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之 所 以 写 这 本 书 , 是 因为 我 觉得 你 应 该 对 你 使 用 的 计算 机 有 所 了 解 。 你 应 该 可 以 让 软件 去 做 
你 想 让 它 去 做 的 事 〈 当然 要 在 它 的 能 力 范围 之 内 )。 要 做 到 这 一 点 ， 关 键 是 必须 理解 软件 能 做 什 
么 ,以 及 是 怎么 做 的 。 这 些 正 是 本 书 要 介绍 的 内 容 。 这 样 你 就 不 必 对 着 计算 机 抓 狂 了 。 

如 果 你 要 学 习 这 方面 的 知识 ，Linux 是 一 个 很 好 的 平台 ， 因 为 它 是 一 个 透明 的 系统 。 特 别 是 


大 多 数 系统 配置 都 存放 在 文本 文件 中 , 让 人 一 目 了 然 。 难 点 在 于 了 解 每 个 组 件 分 别 负 责 什 么 ， 以 
及 它们 如 何 协同 工作 。 
读者 对 象 


我 们 学 习 Linux 的 原因 可 能 各 不 相同 。 对 于 IT 从 业者 〈 如 系统 运 维 人 员 ) 来 说 ， 他 们 需要 了 
解 本 书 中 的 几乎 所 有 内 容 。 对 于 Linux 软 件 架 构 师 和 开发 人 员 来 说 , 他们 同样 需要 了 解 这 些 内 容 ， 
以 便 发 挥 操 作 系 统 的 最 大 功效 。 对 于 只 需 考 虑 个 人 所 用 Linux 系 统 的 研究 人 员 和 学 生来 说 ， 本 书 
能 够 让 他 们 理解 为 什么 系统 是 那个 样子 的 。 

还 有 一 些 堪 称 多 面 手 的 读者 ， 出 于 兴趣 、 谋 利 或 其 他 原因 而 摆弄 计算 机 ,喜欢 探究 事情 的 根 
源 ， 喜 欢 尝 试 不 同 的 可 能 性 。 或 许 你 就 是 其 中 一 位 。 


阅读 要 求 


虽然 开发 人 员 热 爱 Linux， 不 过 并 非 开 发 人 员 才 能 阅读 本 书 ， 只 要 你 有 一 些 基础 的 计算 机 知 
识 即 可 。 也 就 是 说 ， 你 需要 知道 如 何 操作 GUI ( 特别 是 能 看 懂 各 种 Linux 发 行 版 的 安装 和 配置 界 
面 )， 需 要 知道 什么 是 文件 什么 是 目录 ( 文件 夹 ) 此外， 还 要 有 心理 准备 随时 查看 系统 文档 或 者 
上 网 搜索 一 些 相关 文章 。 当 然 ， 我 前 面 提 过 ， 最 重要 的 是 你 对 电脑 的 热情 。 


阅读 方法 


要 对 任何 技术 建立 起 系统 的 认识 都 不 是 件 容易 的 事 。 而 说 到 软件 系统 的 工作 原理 , 就 更 复杂 
了 。 有 时 候 面 对 大 量 的 技术 细 方 ,读者 会 难以 抓 住 重点 ( 因为 人 类 大 脑 无 法 同时 处 理 太 多 新 概念 )， 
但 是 如 果 解 释 得 不 够 透彻 ， 又 会 让 读者 一 知 半 解 ， 不 利于 后 面 的 学 习 。 

本 书 每 一 章 都 会 先 介绍 最 重要 最 基本 的 知识 ， 以 便 让 读者 能 够 继续 深入 。 为 了 突出 重点 ， 有 


图 灵 社 区 会 员 小 虎 (164142021@qq.com) 专 享 尊重 版 权 


些 地 方 简化 了 很 多 内 容 。 随 着 一 章 内 容 的 展开 , 更 多 细节 才 会 在 最 后 几 节 出 现 。 这 些 内 容 需要 你 
马上 就 掌握 吗 ? 通常 不 用 ,我 经 常 也 会 这 么 提醒 你 。 如 果 你 觉得 正在 阅读 的 内 容 有 些 枯燥 难 懂 ， 
可 以 随时 跳 到 下 一 章 或 者 稍 事 休息 。 


动手 操作 


你 最 好 准备 一 台 可 以 用 来 实际 操作 的 Linux 计 算 机 。 你 可 以 使 用 虚拟 机 ， 比 如 我 就 使 用 
VirtualBox 来 测试 本 书 中 的 很 多 实例 。 你 需要 拥有 超级 用 户 (root ) 权限 , 不 过 多 数 情 况 下 你 需要 
以 普通 用 户 身 份 登录 系统 。 我 们 将 主要 通过 终端 窗口 或 者 远程 会 话 来 运行 命令 行 。 如 果 你 之 前 毫 
无 经 验 也 无 大 碍 ， 书 中 第 2 章 会 让 你 尽快 上 手 。 

书 中 的 命令 通常 是 像 下 面 这 样 : 


$1s/ 
[输出 结果 ] 


你 只 需 输入 第 一 行 粗 体 的 文本 ， 非 粗 体 的 文本 是 系统 的 输出 结果 。$ 是 普通 用 户 提示 符 。 如 
果 你 是 超级 用 户 的 话 则 是 #。( 详 见 第 2 章 。) 


本 书 结构 


本 书 分 为 三 个 部 分 。 第 一 部 分 整体 介绍 Linux 系 统 以 及 运行 Linux 系 统 所 需 的 常用 工具 和 命 
令 。 随 后 我 们 会 根据 系统 启动 的 大 体 顺 序 ， 更 深入 地 介绍 从 设备 管理 到 网 络 配置 的 各 个 部 分 。 最 
后 我 们 会 演示 系统 各 部 分 的 运行 方式 ， 并 介绍 一 些 基 本 技巧 和 开发 人 员 常 用 的 工具 。 

除 第 2 章 以 外 ， 开 始 的 几 童 均 主要 讲解 Linux 内 核 ， 然 后 逐步 涉及 用 户 空间 。( 如 果 你 现在 对 
我 所 说 的 一 头 雾 水 也 没关系 ， 我 们 将 在 第 1 章 中 介绍 这 些 概念 。) 

本 书 的 内 容 尽量 保证 对 各 个 版 本 的 Linux 系 统 均 适 用 。 但 要 涵盖 各 个 系统 之 间 的 差异 也 实在 
是 项 繁琐 的 工作 , 所 以 我 尽量 考虑 两 个 主要 的 Linux 版 本 : Debian ( 包括 Ubuntu ) 和 RHEL/Fedora/ 
CentOS。 本 书 主要 针对 的 是 桌面 和 服务 需 系 统 。 诅 人 式 系统 (如 Android 和 OpenWRT ) 也 多 有 涉 
及 ,但 各 系统 之 间 的 差异 还 需要 你 自己 去 探索 。 


第 2 版 的 新 内 容 


本 书 的 第 1 版 侧重 于 从 用 户 的 角度 来 介绍 Linux 系 统 , 骨 在 帮助 读者 了 解 系统 各 部 分 的 工作 原 
理 。 彼 时 Linux 上 的 软件 安装 和 配置 还 不 是 那么 容易 。 

有 孝 的 是 ， 随 着 各 种 新 版 本 的 出 现 , 这 些 问 题 已 然 不 复 存 在 ， 所 以 我 剔除 了 一 些 较 为 陈旧 和 
不 太 相 关 的 内 容 ( 比如 打印 )， 以 便 能 够 更 加 深入 地 介绍 Linux 内 核 。 你 可 能 没有 意识 到 你 将 会 多 
么 频繁 地 和 内 核 打交道 。 

当然 , 上 一 版 中 的 很 多 内 容 随 着 时 间 推 移 也 发 生 了 较 大 变化 , 我 花 了 大 量 的 精力 梳理 和 更 新 
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了 它们 ， 特 别 是 在 Linux 的 启动 和 设备 管理 方面 。 我 对 很 多 内 容 也 进行 了 重新 组 织 ， 以 满足 当下 
读者 的 阅读 兴趣 与 需要 。 

本 书 没有 发 生变 化 的 是 它 的 厚度 。 我 希望 读者 能 够 尽快 上 手 , 因此 会 解释 一 些 不 太 容 易 理 解 
的 细节 , 但 我 又 不 想 让 这 本 书 变 得 你 拿 都 拿 不 动 。 只 要 掌握 了 本 书 介绍 的 知识 ， 自 己 再 去 深入 探 
索 就 不 是 一 件 难 事 了 。 

我 还 删 掉 了 第 1 版 中 一 些 关 于 历史 背景 的 介绍 ,目的 是 突出 重点 。 如 果 你 对 Linux 和 Unix 的 历 
史 感 兴趣 , 可 以 参考 Peter H. Salus 所 车 The Daemon, the Gnu, and the Penguin (Reed Media Services ， 
2008 )， 这 本 书 详细 介绍 了 我 们 使 用 的 各 种 软件 的 历史 沿革 。 


关于 术语 
关于 操作 系统 中 某 些 组 件 应 该 叫 什么 ， 一 直 都 存在 争论 。 甚 至 “Linux” 是 否 应 该 叫 作 


“GNU/Linux” 也 存在 争论 ， 因 为 其 中 使 用 了 GNU 项 目的 成 果 。 本 书 中 我 们 尽量 使 用 通用 术语 ， 
不 使 用 抛 口 、 生 硬 的 词汇 。 
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第 1 版 书评 


“非常 棒 的 书 。 在 近 350 页 的 内 容 中 涵盖 了 Linux 的 所 有 基础 知识 。” 
——EWEEK 
“对 于 那些 想 要 学 习 Linux, 同时 对 操作 系统 内 部 工作 原理 又 不 太 熟 悉 的 读者 , 本 书 绝对 值得 
推荐 。” 
——O’REILLYNET 
“介绍 Linux 基础 知识 最 好 的 书 之 一 ， 同 时 也 适合 Linux 高 级 用 户 阅 读 ， 五星。” 


一 -OPENSOURCE-BOOK-REVIEWS.COM 


“本 书 的 成 功 源 于 它 对 内 容 的 良好 组 织 和 对 技术 细节 的 深入 探讨 。” 


一 一 KICKSTITART NEWS 


“本 书 对 Linux 的 介绍 可 谓 标 新 立 异 。 它 朴实 无 华 ， 注 重 对 命令 行 的 介绍 ， 并 且 深 入 到 系统 
内 部 ， 而 非 仅仅 停留 在 图 形 用 户 界 面 。” 


一 一 IECHBOOKREPORT.COM 


“本 书 很 好 地 介绍 了 Linux 系统 的 工作 原理 。” 


一 HOSTING RESOLVE 
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慨 述 


乍 看 起 来 ，Linux 这 样 的 现代 操作 系统 非常 复杂 ， 内 部 
有 多 得 令 人 眼花 综 乱 的 各 种 组 件 在 同步 运行 和 相互 通信 。 比 
如 : Web 服 务 器 可 以 连接 到 数据 库 服务 器 ,还 有 可 能 用 到 很 
多 其 他 程序 也 在 使 用 的 公共 组 件 。 那么 ， 整 个 系统 究竟 是 怎 
样 运作 的 呢 ? 


理解 操作 系统 工作 原理 最 好 的 方法 是 抽象 思维 , 换 句 话说 , 你 可 以 暂时 忽略 大 部 分 细 方 。 就 
像 坐 车 一 样 ， 通常 你 不 会 去 在 意 车 内 固定 发 动机 的 装配 螺栓 ， 也 不 会 关心 你 走 的 路 是 谁 修筑 的 。 
如 果 你 是 一 个 乘客 的 话 , 你 可 能 只 关心 车 要 做 的 事情 ( 比如 车 要 把 你 带 到 哪 ) 以 及 车 的 一 些 基 本 
操作 ( 比如 如 何 打 开车 门 、 怎 样 系 好 安全 带 )。 

但 如 果 你 在 开车 的 话 ， 就 需要 了 解 更 多 的 细节 ， 比 如 如 何 控制 油门 、 怎 样 换 挡 ， 还 有 如 何 处 
理 意 外 情况 。 

如 果 我 们 觉得 开车 这 个 事情 太 复 杂 , 就 可 以 运用 “抽象 思维 ”来 帮助 理解 。 首先 你 可 以 将 “一 
辆 汽车 在 路 上 行驶 ”抽象 为 三 个 部 分 : 汽车 、 道 路 和 驾驶 操作 。 这 样 有 助 于 将 复杂 的 问题 分 解 开 
来 。 如 果 道 路 颠 艇 ， 你 不 会 去 埋怨 车 辆 本 身 和 你 的 驾驶 技术 。 相 反 ， 你 可 能 会 问 为 什么 这 条 路 这 
么 烂 ,， 或 者 如 果 这 是 条 新 修 的 路 的 话 ， 那 么 筑 路 工人 的 活 干 得 可 真 够 差劲 的 。 

软件 开发 人 员 运 用 抽象 思维 来 开发 操作 系统 和 应 用 程序 。 在 计算 机 软件 领域 有 许多 术语 来 描 
述 抽象 的 子 系统 ， 如 子 系统 、 模 块 和 包 等 。 本 书 中 我 们 使 用 组 件 这 个 相对 简单 的 词 。 在 软件 开发 
过 程 中 ,开发 人 员 通 常 不 用 太 关 心 他 们 需要 使 用 的 组 件 的 内 部 结构 , 他们 只 关心 能 使 用 哪些 组 件 ， 
以 及 怎么 个 用 法 。 

本 章 概述 了 Linux 操 作 系统 涉 及 的 主要 组 件 。 虽 然 每 一 个 组 件 都 包含 纷繁 复杂 的 技术 细 方 ， 
但 我 们 将 暂时 忽略 这 些 细节 ， 而 专注 于 这 些 组 件 在 系统 中 发 挥 的 功能 。 
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2 第 1 章 概述 


1.1 Linux 操作 系统 中 的 抽象 级 别 和 层次 


在 组 织 得 当 的 前 提 下 , 通过 抽象 将 系统 分 解 为 组 件 有 助 于 我 们 了 解 其 工作 机 制 。 我 们 将 组 件 
划分 为 层次 或 级 别 。 组 件 的 层次 (或 级 别 ) 代表 它 在 用 户 和 硬件 系统 之 间 所 处 的 位 置 。Web 浏 览 
器 、 游 戏 等 应 用 处 于 最 高 层 ， 底 层 则 是 计算 机 硬件 系统 ， 如 内 存 。 操 作 系统 处 于 这 两 层 之 间 。 

Linux 操 作 系统 主要 分 为 三 层 。 如 图 1-1 所 示 , 最 底层 是 硬件 系统 , 包括 内 存 和 中 央 处 理 融 (用 
于 计算 和 从 内 存 中 读 写 数据 )， 此 外 硬盘 和 网 络 接口 也 是 硬件 系统 的 一 部 分 。 

硬件 系统 之 上 是 内 核 , 它 是 操作 系统 的 核心 。 内 核 是 运行 在 内 存 中 的 软件 ， 它 向 中 央 处 理 器 
发 送 指 令 。 内 核 管理 硬件 系统 ， 是 硬件 系统 和 应 用 程序 之 间 进 行 通信 的 接口 。 

进程 是 指 计算 机 中 运行 的 所 有 程序 ， 由 内 核 统一 管理 ， 它 们 组 成 了 最 顶层 ， 称 为 用 户 空间 。 
( 另 一 个 更 确切 的 术语 是 用 户 进程 ， 无 论 它 们 是 否 直接 和 用 户 交 互 。 例 如 ， 所 有 的 Web 服 务 器 都 
是 以 用 户 进 程 的 形式 运行 的 。) 


户 进程 


图 形 用 户 界面 | | 服务 器 | | 命 信行 | 


Linux 内 核 


设备 驱动 程序 


Ph 央 处 理 器 (CPU) 主 内 存 (RAM) 


图 1-1 Linux 系 统 的 基本 组 成 


内 核 和 用 户 进 程 之 间 最 主要 的 区 别 是 : 内核 在 内 核 模 式 ( kernel mode ) 中 运行 ， 而 用 户 进程 
则 在 用 户 模式 (usermode ) 中 运行 。 在 内 核 模 式 中 运行 的 代码 可 以 不 受 限 地 访问 中 央 处 理 器 和 内 
存 ， 这 种 模式 功能 强大 , 但 也 非常 危险 , 因为 内 核 进 程 可 以 轻而易举 地 使 整个 系统 骨 演 。 那 些 只 
有 内 核 可 以 访问 的 空间 我 们 称 为 内 核 空间 (kernel space )。 

相对 于 内 核 模式 , 用 户 模 式 对 内 存 和 中 央 人 处理 器 的 访问 有 一 定 程度 的 限制 , 可 访问 的 内 存 空 
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1.3 内核 3 


间 通 常 很 小 , 对 CPU 的 操作 也 很 安全 。 用 户 空间 指 的 是 那些 用 户 进程 能 够 访问 的 内 存 空间 。 如 果 
一 个 用 户 进程 出 错 并 骨 溃 的 话 ， 其 导致 的 后 果 也 相对 有 限 ， 并 且 能 够 被 内 核 清 理 掉 。 例 如 ， 如 果 
你 的 Web 浏 览 器 骨 演 了 ， 不 会 影响 到 你 正在 运行 的 其 他 程序 。 

理论 上 来 说 , 一 个 用 户 进程 出 问题 并 不 会 对 整个 系统 造成 严重 的 影响 。 当 然 这 取决 于 我 们 如 
何 定义 “严重 的 影响 ,并且 还 取决 于 该 进程 拥有 的 权限 。 因 为 不 同 的 进程 拥有 的 权限 可 能 不 同 ， 
一 些 进 程 能 够 执行 一 些 别 的 进程 无 权 执行 的 操作 。 举 个 例子 , 如果 拥 有 足够 的 权限 , 用 户 进程 可 
以 将 硬盘 上 的 数据 全 部 清除 。 也 许 你 会 觉得 这 样 太 危 险 , 但 好 在 操作 系统 提供 了 一 些 相关 的 安全 
措施 ， 而 且 大 多 数 用 户 进程 并 没有 这 个 权限 。 


1.2 ”硬件 系统 : 理解 主 内 存 


主 内 存 ( main memory ) 或 许 是 所 有 硬件 系统 中 最 为 重要 的 部 分 。 基 本 上 来 讲 , 主 内 存 存储 0 
和 1 这 样 的 数据 。 我 们 将 每 个 0 和 1 称 为 一 个 比特 (或 位 ，bit )。 内 核 和 进程 就 在 主 内 存 中 运行 , 它 
们 就 是 一 系列 比特 的 大 合集 。 所 有 外 围 设备 的 数据 输入 和 输出 都 通过 主 内 存 完成 ,同样 是 以 一 系 
列 0 和 1 的 形式 。 中 央 处 理 器 像 一 个 操作 员 一 样 处 理 内 存 中 的 数据 ,， 它 从 内 存 读 取 指 令 和 数据 ， 然 
后 将 运算 结果 写 回 内 存 。 

在 我 们 谈论 内 存 、 进 程 、 内 核 和 其 他 内 容 时 ， 你 会 经 常 看 到 状态 (state ) 这 个 词 。 严 格 说 来 ， 
一 个 状态 就 是 一 组 特定 排列 的 比特 。 例 如 ,内存 中 0110、0001 和 1011 这 三 组 比特 值 即 表示 三 个 不 
同 的 状态 。 

一 个 进程 动 加 由 几 百 万 个 比特 值 组 成 , 因而 使 用 抽象 词汇 来 描述 状态 可 能 比 使 用 比特 值 更 简 
单一 些 。 我们 可 以 使 用 进程 已 经 完成 的 任务 或 者 当前 正在 执行 的 任务 来 描述 其 状态 ,如 “进程 正 
在 等 待 用 户 输入 ”或 者 “进程 正在 执行 启动 任务 的 第 二 个 阶段 ”。 


注解 ”我 们 通常 使 用 抽象 词汇 而 非 比 特 值 来 描述 状态 ,映像 (image ) 这 个 词 用 来 表示 比特 值 在 
内 存 中 的 特定 物理 排列 。 


1.3 内核 


我 们 之 所 以 介绍 主 内 存 和 状态 , 是 因为 内 核 的 几乎 所 有 操作 都 和 主 内 存 相 关 。 其 中 之 一 是 将 
内 存 划 分 为 很 多 区 块 ， 并 且 一 直 维 护 着 这 些 区 块 的 状态 信息 。 每 一 个 进程 拥有 自己 的 内 存 区 块 ， 
且 内 核 必 须 确 保 每 个 进程 只 使 用 它 自己 的 内 存 区 块 。 

内 核 负 责 管理 以 下 四 个 方面 。 
口 进程 : 内核 决 定 哪个 进程 可 以 使 用 CPU。 
口 内 存 : 内 核 管理 所 有 的 内 存 ， 为 进程 分 配 内 存 ， 管 理 进 程 间 的 共享 内 存 以 及 空闲 内 存 。 
口 设备 驱动 程序 : 作为 硬件 系统 ( 如 磁盘 ) 和 进程 之 间 的 接口 ， 内 核 负 责 操控 硬件 设备 。 
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口 系统 调用 和 支持 : 进程 通常 使 用 系统 调用 和 内 核 进行 通信 。 
下 面 我 们 详细 介绍 一 下 这 四 个 方面 。 


注解 ”如 果 你 对 内 核 的 详细 工作 原理 感 兴趣 ， 可 以 参考 Abraham Silberschalz、Peter B. Galvin 和 
Greg Gagne 所 著 Operating System Concepts, 9th Edition ( Wiley，2012 )， 以 及 Andrew S. 
Tanenbaum 和 Herbert Bos 所 著 Modern Operating Systems, 4th Edition ( Prentice Hall，2014 ) 
这 两 本 书 。 


1.3.1 ”进程 管理 


进程 管理 涉及 进程 的 启动 、 暂 停 、 恢 复 和 终止 。 启 动 和 终止 进程 比较 直观 , 但 是 要 解释 清楚 
进程 在 执行 过 程 中 如 何 使 用 CPU 则 相对 复杂 一 些 。 

在 现代 操作 系统 中 ,很 多 进程 貌似 都 是 “同时 ”运行 的 。 例 如 ， 你 可 以 同时 在 桌面 打开 Web 
浏览 器 和 电子 表格 应 用 程序 。 然 而 , 虽然 它们 表面 上 看 是 同时 运行 , 但 实际 上 这 些 应 用 程序 背后 
的 进程 并 不 完全 是 同时 运行 的 。 

我 们 设想 一 下 ,在 只 有 一 个 CPU 的 计算 机 系统 中 ， 可 能 会 有 很 多 进程 可 以 使 用 CPU, 但 是 在 
任何 一 个 特定 的 时 间 段 内 只 能 有 一 个 进程 可 以 使 用 CPU。 所 以 实际 上 是 多 个 进程 轮流 使 用 CPU， 
每 个 进程 使 用 一 段 时 间 后 就 暂停 ， 然 后 让 另 一 个 进程 使 用 ,依次 轮流 ,时 间 单 位 是 毫秒 级 。 一 个 
进程 让 出 CPU 使 用 权 给 另 一 个 进程 称 为 上 下 文 切换 (context switch )。 

进程 在 其 时 间 段 内 有 足够 的 时 间 完 成 主要 的 计算 工作 (实际 上 , 进程 通常 在 单个 时 间 段 内 就 
能 完成 它 的 工作 )。 由 于 时 间 段 非常 短 ， 短 到 我 们 根本 察觉 不 到 ， 所 以 在 我 们 看 来 ， 系 统 是 在 同 
时 运行 多 个 进程 ( 我 们 称 之 为 多 任务 执行 )。 

内 核 负责 上 下 文 切换 。 我 们 来 看 看 下 面 的 场景 ， 以 便 理 解 它 的 工作 原理 。 

(1) CPU 为 每 个 进程 计时 ， 到 时 即 停止 进程 ， 并 切换 至 内 核 模式 ， 由 内 核 接 管 CPU 控 制 权 。 

(2) 内 核 记录 下 当前 CPU 和 内 存 的 状态 信息 ， 这 些 信息 在 恢复 被 停止 的 进程 时 需要 用 到 。 

(3) 内 核 执 行 上 一 个 时 间 段 内 的 任务 〈 如 从 输入 输出 设备 获得 数据 ， 磁 盘 读 写 操 作 等 )。 

(4) 内 核准 备 执行 下 一 个 进程 ， 从 准备 就 绪 的 进程 中 选择 一 个 执行 。 

(5) 内 核 为 新 进程 准备 CPU 和 内 存 。 

(6) 内 核 将 新 进程 执行 的 时 间 段 通知 CPU。 

(7) 内 核 将 CPU 切换 至 用 户 模式 ， 将 CPU 控制 权 移交 给 新 进程 。 

上 下 文 切换 回答 了 一 个 十 分 重要 的 问题 ， 即 内 核 是 在 什么 时 候 运 行 的。 答案 就 是 ,内 核 是 在 
上 下 文 切 换 时 的 时 间 段 间隙 中 运行 的 。 

在 多 CPU 系 统 中 ,情况 要 稍微 复杂 一 些 。 如 果 新 进程 将 在 男 一 个 CPU 上 运行 ， 内 核 就 不 需要 
让 出 当前 CPU 的 使 用 权 。 不 过 为 了 将 所 有 CPU 的 使 用 效率 最 大 化 ， 内 核 会 使 用 一 些 其 他 的 方式 来 
获取 CPU 控 制 权 。 
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1.3.2 ”内 存 管理 


内 核 在 上 下 文 切 换 过 程 中 管理 内 存 , 这 是 一 项 十 分 复杂 的 工作 ,因为 内 核 要 保证 以 下 所 有 条 件 : 
口 内 核 需要 自己 的 专 有 内 存 空间 ， 其 他 的 用 户 进程 无 法 访问 ; 

口 每 个 用 户 进程 有 自己 的 专 有 内 存 空间 ; 

口 一 个 进程 不 能 访问 另 一 个 进程 的 专 有 内 存 空间 ; 

口 用 户 进 程 之 间 可 以 共享 内 存 ; 

口 用 户 进程 的 某 些 内 存 空 间 可 以 是 只 读 的 ; 

口 通过 使 用 磁盘 交换 ， 系 统 可 以 使 用 比 实际 内 存 容量 更 多 的 内 存 空间 。 

新 型 的 CPU 提供 了 MMU ( Memory Management Unit， 内 存 管理 单元 )，MMU 使 用 了 一 种 叫 
作 虚 拟 内 存 的 内 存 访 问 机 制 , 即 进程 不 是 直接 访问 内 存 的 实际 物理 地 址 , 而 是 通过 内 核 使 得 进程 
看 起 来 可 以 使 用 整个 系统 的 内 存 。 当 进程 访问 内 存 的 时 候 ，MMU 截 获 访问 请 求 ， 然 后 通过 内 存 
映射 表 将 要 访问 的 内 存 地 址 转换 为 实际 的 物理 地 址 。 内 核 需 要 初始 化 、 维 护 和 更 新 这 个 地 址 映射 
表 。 例如， 在 上 下 文 切换 时 ， 内 核 将 内 存 映 射 表 从 被 移出 进程 转 给 被 移入 进程 使 用 。 


注解 ”内 存 地 址 映射 通过 内 存 页 面 表 ( page table ) 来 实现 。 
关于 内 存 性 能 ， 我 们 将 在 第 8 章 详细 介绍 。 


1.3.3 设备 驱动 程序 和 设备 管理 


对 于 设备 来 说 ,内 核 的 角色 比较 简单 。 通 常设 备 只 能 在 内 核 模式 中 被 访问 (例如 用 户 进程 请 
求 内 核 关闭 系统 电源 )， 因 为 设备 访问 不 当 有 可 能 会 让 系统 崩溃 。 另 一 个 原因 是 不 同 设备 之 间 没 
有 一 个 统一 的 编程 接口 ， 即 使 同类 设备 也 如 此 ， 比 如 两 个 不 同 的 网 卡 。 所 以 设备 驱动 程序 传统 意 
义 上 来 说 是 内 核 的 一 部 分 ， 它 们 尽 可 能 为 用 户 进程 提供 统一 的 接口 ， 以 简化 开发 人 员 的 工作 。 


1.3.4 系统 调用 和 系统 支持 


内 核 还 对 用 户 进 程 提供 其 他 功能 。 例 如 ， 系 统 调 用 ( system call 或 syscall ) 为 进程 执行 一 些 
它们 不 擅长 或 无 法 完成 的 工作 。 打 开 、 读 取 和 写 文件 这 些 操作 都 涉及 系统 调用 。 

fork() 和 exec() 这 两 个 系统 调用 对 于 我 们 了 解 进程 如 何 启动 很 重要 。 
口 fork() : 当 进 程 调用 fork() 时 ， 内 核 创建 一 个 和 该 进程 几乎 一 模 一 样 的 副本 。 
口 exec(): 当 进 程 调用 exec(program) 时 ， 内 核 启 动 program 来 替换 当前 的 进程 。 

除了 init (参见 第 6 章 ) 以 外 ，Linux 中 的 所 有 用 户 进程 都 是 通过 fork() 来 启动 的 。 除 了 创建 现 
有 进程 的 副本 外 ,大 多 数 情况 下 你 还 可 以 使 用 exec() 来 启动 新 的 进程 。 一 个 简单 的 例子 是 你 在 命 
令 行 运行 ]s 命 令 来 显示 目录 内 容 。 当 你 在 终端 窗口 中 输入 ls 时 ,终端 窗口 中 的 shell 调 用 fork() 创 
建 一 个 shell 的 副本 ， 然 后 该 副本 调用 exec(1s) 来 运行 1s。 图 1-2 显 示 启 动 1s 这 样 的 命令 时 进程 和 系 
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图 1-2 ”新 进程 的 启动 


注解 ”系统 调用 通常 使 用 括号 来 标记 。 图 1-2 中 ， 进 程 请 求 内 核 使 用 fork() 系 统 调用 创建 一 个 新 
的 进程 。 这 样 的 标记 来 源 于 C 编 程 语 言 。 阅 读本 书 你 不 需要 有 C 语 言 的 知识 ， 只 需要 记 住 
系统 调用 是 进程 和 内 核 之 间 的 交互 方式 。 此 外 ， 本 书 中 我 们 简化 了 很 多 系统 调用 。 例 如 
exec() 实 际 上 是 一 系列 具有 相似 功能 的 系统 调用 ， 只 是 代码 实现 有 所 不 同 。 


除了 传统 的 系统 调用 ,内 核 还 为 用 户 进程 提供 其 他 很 多 功能 ， 最 为 常见 的 是 虚拟 设备 。 虚 拟 
设备 对 于 用 户 进程 而 言 是 物理 设备 ,但 其 实 它们 都 是 通过 软件 实现 的 。 因 此 从 技术 角度 来 说 , 它 
们 并 不 需要 存在 于 内 核 中 ,但 是 实际 上 它们 很 多 都 存在 于 内 核 中 。 例 如 : 内 核 的 随机 数 生成 器 
( /dev/random ) 这 样 的 虚拟 设备 ， 如 果 由 用 户 进程 来 实现 ， 难 度 要 大 很 多 。 


注解 ”从 技术 上 说 ， 用 户 进程 还 是 需要 通过 使 用 系统 调用 打开 设备 的 方式 来 访问 虚拟 设备 ， 所 
以 进程 总 是 避免 不 了 要 和 系统 调用 打交道 。 


1.4 用户 空间 


前 面 提 到 过 , 内核 分 配给 用 户 进程 的 内 存 我 们 称 之 为 用 户 空间 。 因 为 一 个 进程 简单 说 就 是 内 
存 中 的 一 个 状态 。 用 户 空间 也 可 以 指 所 有 用 户 进程 占用 的 所 有 内 存 。( 用 户 空间 还 有 一 个 不 太 正 
式 的 名 称 ， 叫 userland。) 

Linux 中 大 部 分 的 操作 都 发 生 在 用 户 空间 中 。 虽 然 从 内 核 的 角度 来 说 所 有 进程 都 是 一 样 的 ， 
但 是 实际 上 它们 执行 的 是 不 同 的 任务 。 相 对 于 系统 组 件 , 用 户 进程 位 于 一 个 基础 服务 层 中 。 图 1-3 
就 展示 了 一 组 组 件 在 Linux 系 统 中 是 如 何 交互 工作 的 。 其 中 最 底层 是 基础 服务 层 ， 工 具 服 务 在 中 
间 ， 用 户 使 用 的 应 用 程序 在 最 上 层 。 图 1-3 是 一 个 简化 版 本 ,你 可 以 看 到 顶层 距离 用 户 最 近 ( 如 
用 户 接口 和 Web 浏 览 器 )。 中 间 一 层 中 有 邮件 服务 器 这 样 的 组 件 供 Web 浏 览 絮 使 用 。 最 下 层 是 一 些 
更 小 的 服务 组 件 。 
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1.5 用 户 


Web 浏 览 器 


诊断 日 志 


图 1-3 ”进程 类 型 和 相互 间 的 交互 


最 下 层 通 常 是 由 一 些小 的 组 件 组 成 , 它们 比较 精巧 ， 专 注 完成 某 一 个 特定 功能 。 中 间 层 的 组 
件 比 较 大 一 些 ， 如 邮件 、 打 印 和 数据 库 服务 。 顶 层 组 件 完成 用 户 交 互 和 复杂 的 功能 。 组 件 之 间 也 
可 以 相互 调用 。 如 果 组 件 A 调用 了 组 件 B 的 功能 , 我 们 可 以 视 为 组 件 A 和 B 在 同一 层级 , 或 者 B 在 A 
之 下 % 

然而 ， 图 1-3 只 是 一 个 粗略 图 ， 实 际 上 用 户 空间 里 没有 很 明显 的 界限 。 例 如 许多 应 用 程序 和 
服务 会 将 系统 诊断 信息 写 入 日 志 , 大 部 分 程序 使 用 标准 的 系统 日 志 服务 来 完成 , 但 也 有 一 些 程序 
是 自己 实现 日 志 功 能 。 

此 外 ,很 多 用 户 空间 组 件 比 较 难 分 类 , 像 Web 服 务 器 和 数据 库 服 务 器 这 样 的 服务 组 件 ， 你 可 
以 认为 它们 在 图 1-3 中 属于 高 级 别 组件 ， 因 为 它们 复杂 度 很 高 。 然 而 用 户 应 用 程序 也 会 经 常 调用 
它们 的 功能 ， 所 以 你 也 可 以 将 它们 归 入 中 级 别 组 件 。 


1.5 用 户 


Linux 内 核 支持 用 户 这 一 Unix 的 传统 概念 。 一 个 用 户 代 表 一 个 实体 ， 它 有 权限 运行 用 户 进程 ， 
对 文件 拥有 所 有 权 。 每 个 用 户 都 有 一 个 用 户 名 , 如 billyjoe。 然而 内 核 是 通过 用 户 ID 来 管理 用 户 的 ， 
用 户 卫 是 一 串 数字 标识 〈 详 见 第 7 章 )。 

用 户 机 制 主要 用 于 权限 管理 。 个 用 户 进 程 都 有 一 个 用 户 作 为 所 有 者 , 我 们 称 其 为 以 该 用 
户 运 行 的 进程 。 在 一 定 限制 条 件 下 ,用户 可 以 终止 和 改变 他 的 进程 的 行为 。 但 是 对 其 他 用 户 的 进 
程 无 权 干 预 。 此 外 ， 用 户 可 以 决定 是 否 将 属于 自己 的 文件 和 其 他 用 户 共享 。 

Linux 操 作 系 统 的 用 户 包括 系统 自 带 用 户 和 供 人 使 用 的 用 户 。 详 情 见 第 3 章 。 其 中 最 关键 的 用 
户 是 root 用 户 〈 意思 是 根 用 户 或 超级 用 户 )。root 用 户 不 受 前 面 提 到 的 种 种 权限 的 限制 ， 它 可 以 终 
止 其 他 用 户 的 进程 ， 读 取 系 统 中 的 任何 文件 。 因 此 root 也 被 称 作 超级 用 户 。Unix 的 系统 管理 员 拥 
有 超级 用 户 权 限 。 
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注解 ”使 用 root 权 限 操作 系统 是 一 件 很 危险 的 事情 ， 因 为 用 户 拥有 最 高 权限 ， 可 以 为 所 谷 为 ， 一 
旦 出 错 很 难 定位 和 恢复 。 因 此 系统 管理 员 通 常 尽量 避免 使 用 root 权 限 。 而 且 ，root 用 户 虽 
然 权 限 很 高 ， 但 是 还 是 在 用 户 模式 而 非 内 核 模 式 中 运行 。 


用 户 组 是 指 一 组 用 户 的 集合 。 用 户 组 的 主要 作用 是 允许 一 个 用 户 同 组 内 的 其 他 用 户 共享 文件 
权限 。 


1.6 ”前 旧 


至 此 我 们 对 Linux 系 统 的 组 成 有 了 一 个 大 致 的 了 解 。 用 户 和 用 户 进 程 交互 ， 内 核 管理 进程 和 
硬件 系统 。 内 核 和 进程 都 在 内 存 中 运行 。 

这 些 基 础 知识 固然 很 重要 , 但 如 果 想 要 了 解 更 多 的 细节 ,你 需要 实际 操作 一 番 。 下 一 章 你 会 
了 解 到 一 些 用 户 空间 的 基础 知识 ， 还 有 本 章 没有 提 及 的 永久 存储 (硬盘 、 文 件 等 )， 就 是 存放 应 
用 程序 和 数据 的 地 方 。 
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第 2 章 


基础 命令 和 目录 结构 


本 章 我 们 将 介绍 Unix 系 统 的 命令 和 工具 , 它们 在 本 书 中 
会 经 常 被 用 到 。 你 可 能 已 经 对 这 些 基本 知识 有 所 了 人 解 ， 不 过 
我 还 是 建议 你 花 些 时 间 再 阅读 一 遍 ， 特 别 是 2.19 节 关于 目录 
结构 的 阐述 。 


你 也 许 会 问 ， 为 什么 要 介绍 Unix 命 令 ? 这 本 书 不 是 关于 Linux 的 吗 ? 没 错 ，Linux 其 实 是 Unix 
的 一 个 变种 ， 它 的 本 质 还 是 Unix。Unix 这 个 词 在 本 章 中 出 现 的 频率 甚至 高 于 Linux， 并 且 你 可 以 
将 本 章 的 知识 直接 应 用 到 其 他 基于 Unix 的 操作 系统 ， 如 Solaris 和 BSD。 我 们 尽量 避免 介绍 太 多 
Linux 特 有 的 内 容 , 一 方面 可 以 让 你 多 了 解 一 点 其 他 的 操作 系统 ， 男 一 方面 也 因为 那些 只 对 Linux 
适用 的 扩展 功能 往往 不 太 稳定 可 靠 。 掌 握 核心 命令 能 够 让 你 很 快 上 手 任何 新 的 基于 Linux 的 操作 
系统 。 


注解 Unix 初学 者 若 想 了 解 更 多 细节 ， 可 以 参考 这 几 本 书 : The Linux Command Line (No Starch 
Press, 2012 )、UNIX for the Impatient ( Addison-Wesley Professional, 1995 ) 和 Learning the 
UNIX Operating System, Sth edition ( O’Reilly, 2001 )。 


2.1 Bourne shell: /bin/sh 


shell 意 思 为 命令 行 界面 ， 是 Unix 操 作 系 统 中 最 为 重要 的 部 分 之 一 。shell 是 运行 命令 行 的 应 用 
程序 ， 而 命令 行 就 是 用 户 输入 的 那些 命令 。 同 时 它 为 Unix 程 序 员 提供 了 一 个 小 的 编程 环境 ,在 这 
里 Unix 程 序 员 可 以 将 通用 的 任务 分 解 为 一 些小 的 组 件 ， 然 后 使 用 shell 来 管理 和 组 织 它们 。 

Unix 操 作 系 统 中 很 多 重要 的 部 分 其 实 都 是 shell 脚 本 ， 它 们 是 包含 一 系列 shell 命 令 的 文本 文 
件 。 如 果 你 用 过 MS-DOS， 你 可 以 将 shell 脚 本 理解 为 功能 强大 的 .bat 批 处 理 文件 。 我 们 将 在 第 11 
章 详细 介绍 shell 脚 本 。 
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通过 本 书 的 阅读 和 练习 ， 你 将 会 逐渐 熟练 地 使 用 shell 来 运行 各 种 命令 。 它 的 一 个 好 处 是 一 旦 
出 现 了 误 操 作 ， 你 可 以 清楚 地 看 到 你 的 输入 错误 ， 然 后 进行 修正 。 

Unix 的 shell 有 很 多 种 ,它们 都 是 基于 Bourne shell ( /bin/sh ) 这 个 贝尔 实验 室 开发 的 标准 shell， 
在 早期 的 Unix 系 统 上 运行 。 所 有 基于 Unix 的 操作 系统 都 需要 Bourne shell 才 能 正常 工作 。 

Linux 使 用 了 一 个 增强 版 本 的 Bourne shell， 我 们 称 之 为 bash 或 者 “Bourne-again” shell。 大 部 分 
Linux 系 统 的 默认 shell 是 bash, 其 通常 有 一 个 符号 链接 /bin/sh。 你 需要 使 用 bash 来 运行 本 书 中 的 例子 。 


注解 ”你 的 Unix 系 统管 理 员 为 你 设置 的 默认 shell 可 能 不 是 bash, 你 可 以 使 用 chsh 命 令 来 更 改 ， 或 
者 请 管理 员 为 你 更 改 。 


2.2 ”shell 的 使 用 


安装 Linux 时 ， 除 了 默认 的 root 账 号 外 ， 你 还 需要 为 自己 创建 至 少 一 个 普通 用 户 账号 , 这些 账 
号 将 会 是 你 的 个 人 账号 。 本 章 中 你 需要 使 用 普通 用 户 账号 。 
2.2.1 shell 窗口 


登录 系统 后 ， 打 开 一 个 shell 窗 口 (也 叫 作 终 端 窗口 )。 打 开 shell 窗 口 最 简单 的 方法 是 ,在 
Gnome 或 者 Ubuntu Unity 这 样 的 图 形 用 户 界面 ( Graphical User Interface， 以 下 简称 GUI ) 中 运行 
终端 程序 ， 这 样 就 可 以 在 新 的 窗口 中 启动 shell。 通 常 在 窗口 的 顶端 你 能 看 到 一 个 $ 提 示 符 。 在 
Ubuntu 上 ， 提 示 符 是 这 样 : name@host:path$( 用 户 名 @ 主 机 名 :路 径 $ )。 在 Fedora 上 ， 提 示 符 是 
这 样 : [name@host path]$。shell 窗 口 类 似 Windows 上 的 DOS，OS XX 系统 上 的 终端 程序 本 质 上 和 
Linux 中 的 shell 窗 口 一 样 。 

本 书 中 的 很 多 命令 都 可 以 在 shell 上 运行 ， 例 如 你 可 以 输入 以 下 命令 行 (不 用 输入 前 面 的 $ )， 
然后 按 回 车 键 : 


$ echo Hello there. 


注解 ”本 书 中 许多 shell 命 令 都 以 # 开 头 ， 需 要 以 root 身 份 来 运行 ， 运 行 时 需要 格外 小 心 。 


现在 试 试 下 面 这 个 命令 : 


$ cat /etc/passwd 


这 个 命令 是 将 文件 /etc/passwd 中 的 内 容 显 示 到 shell 窗 口中 。 有 关 这 个 文件 的 内 容 我 们 会 在 第 7 
章 详 细 介 绍 。 
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2.2.2 cat 命令 


cat 命 令 很 简单 ， 它 显示 一 个 或 者 多 个 文件 的 内 容 ， 命 令 语 法 如 下 : 


$ cat filel file2 ... 


上 面 这 个 cat 命 令 会 显示 和 el 和 fle2 等 文件 的 内 容 ， 然 后 退出 。 之 所 以 叫 cat 是 因为 如 果 有 多 
个 文件 的 话 ， 它 会 把 这 些 文件 的 内 容 拼 接 起 来 显示 。 


2.2.3 ”标准 输入 输出 


我 们 将 使 用 cat 命 令 来 学 习 Unix 的 输入 和 输出 ( 以 下 简称 IO )。Unix 进 程 使 用 1/O 流 来 读 写 数 
据 。 进 程 从 输入 流 中 读 取 数据 ， 向 输出 流 写 出 数据 。 数 据 流 非常 灵活 ， 比 如 输入 流 可 以 是 文件 、 
设备 、 终 端 ， 其 至 还 可 以 是 来 自 其 他 进程 的 输出 流 。 

想 知道 输入 流 的 工作 原理 ， 只 需要 输入 cat 命 令 并 回 车 ， 这 时 候 你 会 看 到 屏幕 上 没有 显示 任 
何 结果 ， 因 为 cat 命 令 仍 在 运行 中 。 现 在 你 输入 几 个 字符 然后 回 车 ， 你 会 看 到 cat 命 令 会 在 屏幕 上 
显示 出 你 刚刚 输入 的 字符 。 最 后 你 可 以 在 任意 空白 行 按 CTRL-D 终 止 cat 命 令 的 执行 并 回 到 shell 
提示 符 。 

你 刚刚 和 cat 命 令 进行 的 一 系列 交互 就 是 通过 数据 流 机 制 来 实现 的 。 因 为 你 没有 指定 输入 文 
件 名 ，cat 命 令 就 从 Linux 内 核 提 供 的 默认 标准 输入 流 中 获得 输入 数据 ， 这 时 运行 cat 命 令 的 终端 
就 成 为 标准 输入 。 


注解 ” 按 CTRL-D 终 止 当前 终端 的 标准 输入 并 终止 命令 (通常 会 终止 一 个 程序 )。 这 和 CTRL-C 
不 一 样 。CTRL-C 是 终止 当前 进程 的 运行 ,无论 是 否 有 输入 和 输出 。 


标准 输出 也 与 之 类 似 。 内 核 为 每 个 进程 提供 一 个 标准 输出 流 供 它们 输出 数据 。cat 命 令 在 终 
端 运行 的 时 候 ， 标 准 输出 就 和 该 终端 建立 连接 ，cat 命 令 将 数据 和 输出 到 标准 和 输出， 就 是 你 在 屏幕 
上 看 到 的 结果 。 

标准 输入 和 标准 输出 通常 简写 为 stdin 和 stdout。 很 多 命令 和 cat 一 样 ， 如 果 你 不 为 它们 指定 输 
入 文件 ， 他 们 就 从 标准 输入 获得 数据 。 输 出 则 有 点 不 同 ， 一 部 分 命令 (如 cat ) 将 数据 输出 到 标 
准 输出 ， 另 一 部 分 命令 可 以 将 数据 直接 输出 到 文件 。 

除了 标准 输入 和 输出 外 ， 还 有 标准 错误 信息 流 ， 我 们 将 在 2.14.1 节 介绍 。 

标准 流 的 一 个 优点 是 你 可 以 随心 所 和 欲 地 指定 数据 的 输入 输出 来 源 ， 在 2.14 节 中 我 们 会 介绍 如 
何 将 流连 接 到 文件 和 其 他 进程 。 


2.3 ”基础 命令 
本 节 将 介绍 更 多 的 Unix 命 令 。 它 们 大 都 需要 输入 参数 ,同时 支持 可 选项 和 格式 ( 由 于 数量 太 


图 灵 社 区 会 员 小 虎 (164142021@qq.com) 专 享 尊重 版 权 


12 第 2 章 基础 命令 和 目录 结构 

多 ， 在 此 不 一 一 列 出 )。 下 面 是 一 些 基础 命令 的 简单 介绍 ， 我 们 暂 不 深入 讲解 。 
2.3.1 ls 命令 

ls 命令 显示 指定 目录 的 内 容 ， 默 认 参 数 为 当前 目录 。1s -1 显示 详细 的 列表 ，1s -F 显 示 文 
件 类 型 信息 (文件 类 型 和 权限 将 在 2.17 节 介绍 )。 下 面 是 文件 详细 列表 的 一 个 示例 , 其 中 第 三 列 
是 文件 的 所 有 者 ， 第 四 列 是 用 户 组 ， 第 五 列 是 文件 大 小 ， 后 面 是 文件 更 改 的 时 间 、 日 期 以 及 文 
件 名 。 
$ 1s -1 
total 3616 
-IW-I--rI-- 1 juser users 3804 Apr 30 2011 abusive.c 
-IW-I--I-- 1 juser Users 4165 May 26 2010 battery.zip 
-IW-I--I-- 1 juser users 131219 Oct 26 2012 beav 1.40-13.tar.gz 
-IW-I--I-- 1 juser users 6255 May 30 2010 country.c 
drwxr-xr-x 2 juser users 4096 Jul 17 20:00 cs335 
-ITWXIT-XT-X 1 juser users 7108 Feb 2 2011 dhry 
-IW-I--I-- 1 juser users 11309 Oct 20 2010 dhry.c 
-IW-I--I-- 1 juser users 56 Oct 6 2012 doit 
drwxr-xr-x 6 juser users 4096 Feb 20 13:51 dw 
drwxr-xr-x 3 juser users 4096 May 2 2011 hough-stuff 


一 列 中 的 d 我 们 将 在 2.17 节 详细 介绍 


2.3.2 cp 命令 


cp 命 


命令 用 来 复制 文件 。 下 面 的 命 


令 将 文件 flel 复 制 到 文件 file2 : 


$ cp files filez 


下 面 的 命令 将 多 个 文件 (fel .. 


. fileN ) 复制 到 目录 dir: 


$ cp filel ... 


fileNW dir 


2.3.3 ”mv 命令 


令 有 点 类 


mV 命令 


似 cp， 用 来 重 命名 文件 。 


下 面 的 命令 将 文件 名 从 filel 重 命名 为 file2: 


$ mv Filel file2 


你 也 可 以 使 用 mv 将 多 个 文件 移动 到 某 个 目录 : 


$ mv filel ... 


fileN dir 
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2.3.4 touch 命令 


touch 命 令 用 来 创建 文件 。 如 果 文 件 已 经 存在 ， 则 该 命令 会 更 新 文件 的 时 间 戳 ， 就 是 我 们 在 
ls -1 命令 的 执行 结果 中 看 到 的 文件 更 新 时 间 和 日 期 。 下 面 的 命令 创建 一 个 新 的 文件 ， 内 容 为 空 : 


$ touch fil1e 


如 果 我 们 对 文件 执行 1s -1， 你 将 会 看 到 下 面 的 显示 结果 ， 其 中 人 @ 就 是 文件 被 创建 的 时 间 和 
日 期 : 


$ 1s -1 file 
-IW-I--I-- 1 juser users 0 May 21 18:32@ file 


2.3.5 Im 命令 


Im 命令 用 来 删除 文件 ， 文 件 一 旦 被 删除 通常 无 法 恢复 : 


$ rm file 


2.3.6” echo 命令 


echo 命 令 将 它 的 参数 显示 到 标准 输出 ， 例 如 : 


$ echo Hello again. 
Hello again. 


我 们 在 查看 shell 通 配 符 展开 ( 如 * 这 样 的 通配符 ) 和 环境 变量 ( 如 $HOME ) 的 时 候 经 常 使 用 echo 
命令 ， 本 章 稍 后 会 详细 介绍 。 


2.4 浏览 目录 


Unix 的 目录 结构 是 从 /开始 ,有 时 候 也 叫 作 root 目 录 , 目 录 之 间 使 用 斜 杠 /分 隔 , 而 不 是 Windows 
中 的 反 斜 杠 \。root 目 录 / 下 有 子 目 录 ， 如 /usr， 详 见 2.19 节 。 

我 们 通过 路 径 或 路 径 名 来 访问 文件 。 以 /开头 的 路 径 (如 Ausrvlib ) 叫绝 对 路 径 。 

两 个 点 (.. ) 代 表 一 个 目录 的 上 层 目录 。 如 果 你 当前 在 目录 /usvlib 中 , 那 .就 代表 /sr 目录 , ../bin 
则 代表 /usr/bin。 

一 个 点 (. ) 代表 当前 目录 。 如 果 你 当前 在 hsvlib 目录 中 ，. 就 代表 /srlib ，./X11 则 代表 
/usrlib/X11。 通 常 我 们 不 需要 使 用 .， 而 是 直接 使 用 目录 名 来 访问 当前 目录 下 的 子 目 录 ， 如 X11 效 
果 和 ./X11 一 样 。 
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不 以 /开头 的 路 径 叫 相对 路 径 ， 我 们 大 部 分 时 候 都 基于 当前 所 在 目录 使 用 相对 路 径 。 下 面 介 
绍 一 些 和 目录 操作 相关 的 命令 。 


2.4.1 cd 命令 


cd 命令 用 来 设置 当前 工作 目录 。 当 前 工作 目录 是 指 你 的 进程 和 shell 当 前 所 在 的 目录 。 


$ cd dir 


如 果 不 带 dir 参 数 ，cd 命 令 会 返回 你 的 个 人 主 目 录 ， 指 的 是 你 登录 系统 后 进入 的 目录 。 
2.4.2 mkdir 命 今 


mkdir 命 令 用 来 创建 新 目录 ， 例 如 ， 下 面 的 命令 创建 一 个 名 为 dir 的 新 目录 : 


$ mkdir dir 


2.4.3 rmdir 命令 


rmdir 命 令 用 来 删除 目录 : 


$ rmdir dir 


如 果 要 删除 的 目录 里 面 有 内 容 (文件 和 其 他 目录 )， 上 面 的 命令 会 执行 失败 。 因 为 zmdir 只 能 
删除 空 目录 ， 你 可 以 使 用 rm -rf 来 删除 一 个 目录 以 及 其 中 的 所 有 内 容 。 使 用 这 个 命令 的 时 候 要 非 
党 小心， 尤其 是 当 你 是 超级 用 户 ( root 或 superuser ) 的 时 候 。 因 为 -+ 选项 会 依次 删除 dir 中 的 所 有 
文件 和 子 目 录 ，-f 选 项 代表 强制 删除 。 所 以 使 用 -Yf 时 尽量 不 要 在 参数 里 使 用 通配符 〈 如 * )， 并 
且 执行 命令 前 最 好 检查 参数 是 否 正确 。 


2.4.4 ”shell 通 配 符 


shell 可 以 使 用 通配符 来 匹配 文件 名 和 目录 名 。 其 他 的 操作 系统 也 有 通配符 这 个 概念 。 比 如 * 
代表 任意 字符 和 数字 。 下 面 的 命令 列 出 当前 目录 中 的 所 有 文件 : 


$ echo * 


shell 根 据 参 数 中 的 通配符 来 匹配 文件 名 。shell 将 命令 中 的 参数 替换 为 实际 的 文件 名 ， 这 个 过 
程 我 们 称 为 展开 。 比 如 : 
口 at# 展 开 为 所 有 以 at 开头 的 文件 名 ; 
口 *at 展 开 为 所 有 以 at 结尾 的 文件 名 ; 
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口 *at# 展 开 为 所 有 包含 at 的 文件 名 。 
如 果 通 配 符 没 有 匹配 的 文件 名 , shell 就 不 进行 任何 的 展开 , 参数 按照 原样 来 执行 , 比如 : echo 
*dfkdsafh。 


注解 ”如 果 你 惯 于 使 用 MS-DOS， 你 可 能 会 下 意识 地 使 用 *.* 来 匹配 所 有 文件 。 在 Linux 系 统 和 
其 他 Unix 系 统 中 ，*.* 只 匹配 那些 包含 .的 文件 名 和 目录 名 ， 而 Unix 系 统 中 很 多 文件 名 是 
没有 的 。 


另外 一 个 shell 通 配 符 问 号 (? ) 帮助 shell 确 切 匹 配 任意 一 个 字符 ， 如 b?at 与 boat 和 brat 相 匹配 。 
如 果 不 想 让 shell 展 开通 配 符 ， 你 可 以 使 用 单 引 号 ( … )。 例 如 运行 echo '*' 将 会 显示 一 个 *。 
在 一 些 命令 如 grep 和 和 find 中， 这样 做 非常 有 用 (这 一 内 容 将 在 11.2 节 详细 介绍 )。 


注解 ”需要 注意 的 是 ，shell 是 先 展 开通 配 符 ， 然 后 执行 命令 行 。 如 果 *# 传 递 到 命令 行 的 时 候 仍 然 
未 能 展开 ，shell 则 对 此 无 能 为 力 ， 一 切 都 取决 于 命令 本 身 如 何 处 理 。 


现代 shell 的 模式 匹配 能 力 并 不 仅 限 于 此 ， 但 * 和 ?这 两 种 是 你 必须 要 掌握 的 。 
2.5 中 间 命 令 
下 面 我 们 介绍 一 些 基 本 的 Unix 中 间 命 令 。 


2.5.1 grep 命 令 


grep 命 令 显示 文件 和 输入 流 中 和 参数 匹配 的 行 。 如 下 面 的 命令 显示 文件 /etc/passwd 中 包含 文 
本 root 的 所 有 行 : 


$ grep root /etc/passwd 


在 对 多 个 文件 进行 批量 操作 的 时 候 ，grep 命 令 非 常 好 用 ， 因 为 它 显示 文件 名 和 匹配 的 内 容 。 
如 果 你 想 查 看 上 日 录 /etc 中 所 有 包含 root 的 文件 ， 可 以 执行 以 下 命令 : 


$ grep root /etc/* 


grep 命 令 有 两 个 比较 重要 的 选项 ， 一 个 是 -i (不 区 分 大 小 写 ), 一 个 是 -v( 反 转 匹配 ， 就 是 
显示 所 有 不 匹配 的 行 )。grep 还 有 一 个 功能 强大 的 变种 叫 作 egrep( 实际 上 就 是 grep -E )。 

grep 命 令 能 够 识别 正则 表达 式 。 正 则 表达 式 比 通配符 功能 更 强大 ， 下 面 是 两 个 例子 : 
口 * 匹 配 任 意 多 个 字符 ( 类 似 * 通 配 符 ); 
口 .匹配 任意 一 个 字符 。 
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注解 ”帮助 手册 grep(1) 中 有 关于 正则 表达 式 的 详细 说 明 ， 不 过 对 于 读者 来 说 可 能 比较 不 方便 理 
解 。 你 可 以 参考 这 两 本 书 : Mastering Regular Expression, 3rd edition ( O?Reilly，2006 ) 或 
者 Programming Perl, 4th edition ( O?Reilly，2012 ) 中 的 “the regular expression” 一 章 。 如 
果 你 对 数学 和 正则 表达 式 的 历史 感 兴 趣 ， 可 以 参阅 JIntroduction to Automata Theory, 
Language, and Computation, 3rd edition ( Prentice Hall, 2006 )。 


2.5.2 less 命令 


当 要 查看 的 文件 过 大 或 者 内 容 多 得 需要 深 动 屏幕 的 时 候 ， 可 以 使 用 less 命 令 。 如 要 查看 像 
/usr/share/dict/words 这 样 的 大 文件 ， 可 以 使 用 less /usr/share/dict/words 命 令 。less 命 令 可 以 将 
内 容 分 屏 显 示 ， 按 空格 键 可 查看 下 一 屏 ，B 键 查看 上 一 屏 ，Q 键 退出 。 


注解 ”less 命令 实际 上 是 more 命 令 的 增强 版 本 。 绝 大 多 数 Linux 系 统 中 都 有 这 个 命令 ， 但 是 一 些 
Unix 系 统 和 谈 入 式 系统 中 没有 这 个 命令 ， 这 时 你 可 以 使 用 more 命 令 。 


你 可 以 在 less 命 令 的 输出 结果 中 进行 搜索 。 例 如 : 使 用 /word 从 当前 位 置 向 前 搜索 word 这 个 
词 ， 使 用 ?word 从 当前 位 置 向 后 搜索 。 当 找到 一 个 匹配 的 时 候 ， 按 N 键 可 以 跳 到 下 一 个 匹配 。 

你 可 以 将 几乎 所 有 进程 的 输出 作为 另 一 个 进程 的 输入 ， 我 们 将 在 2.14 节 详细 介绍 。 当 你 执行 
的 命令 涉及 很 多 输出 ,或 者 你 想 使 用 less 来 查看 输出 结果 的 时 候 ， 这 个 方法 非常 管用 ， 比 如 下 例 
所 示 : 


$ grep ie /usr/share/dict/words | less 


你 可 以 自己 亲身 实践 一 下 这 个 命令 。 类 似 这 样 的 less 代 码 你 会 常用 到 。 


2.5.3 pwd 命令 


pwd 命 令 仅 输出 当前 的 工作 目录 名 。 这 个 命令 看 上 去 不 是 那么 有 用 ， 其 实 不 然 ， 它 有 以 下 两 
个 用 处 。 

首先 ,并 不 是 所 有 的 提示 符 都 显示 当前 目录 名 ,甚至 有 时 候 你 需要 摆脱 它 ， 因 为 它 占用 很 大 
空间 ， 这 时 候 就 需要 使 用 pwd 来 解决 。 

其 次 ,使 用 符号 链接 (我们 将 在 2.17.2 节 介绍 ) 的 时 候 通常 很 难 获知 当前 目录 信息 ， 这 时 我 
们 可 以 使 用 pwd -P 来 查看 。 


2.5.4 diff 命令 
diff 命 令 用 来 查看 两 个 文件 之 间 的 不 同 ， 例 如 ， 
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$ diff filel file2 


该 命令 有 几 个 选项 可 以 让 你 设置 输出 结果 的 格式 , 不 过 默认 的 格式 对 于 我 们 来 说 已 经 足够 清 
晰 易 读 了 。 很 多 开发 人 员 喜 欢 用 diff -u 格 式 ， 因 为 这 个 格式 能 被 许多 自动 化 工具 很 好 地 识别 。 


2.5.5_ file 命令 


如 果 你 想 知道 一 个 文件 的 格式 信息 ， 可 以 执行 file 命 令 : 


$ file file 


这 个 看 似 平淡 无 奇 的 命令 会 给 你 提供 很 多 有 用 的 信息 。 


2.5.6 find 和 1locate 命 令 


我 们 有 时 候 会 碰 到 一 种 让 人 抓 狂 的 情况 , 就 是 明明 知道 有 那么 一 个 文件 , 但 就 是 不 知道 它 在 
哪个 目录 。 别 急 ， 使 用 find 命 令 可 以 帮 你 在 目录 中 寻找 文件 : 


$ find dir -name file -print 


find 命 令 能 做 很 多 事情 ， 但 是 在 你 确定 你 了 解 -name 和 -print 选 项 之 前 ， 不 要 尝试 诸如 -exec 
这 样 的 选项 。find 命 令 可 以 使 用 模式 匹配 参数 ( 如 * )， 但 是 必须 加 引号 (*)， 以免 shell 自 动 将 它 
们 展开 。( 回想 2.4.4 节 讲 的 ，shell 在 运行 命令 前 会 展开 通配符 。) 

另外 一 个 查找 文件 的 命令 是 locate。 和 find 不 同 的 是 ，locate 在 系统 创建 的 文件 索引 中 查找 
文件 。 这 个 索引 由 操作 系统 周期 性 地 进行 更 新 ， 查 找 速 度 比 find 更 快 。 但 是 locate 对 于 查找 新 创 
建 的 文件 可 能 会 无 能 为 力 ， 因 为 它们 有 可 能 还 没有 被 加 入 到 索引 中 。 


2.5.7 head 和 tail 命 令 


head 命 令 显 示 文 件 的 前 10 行 内 容 (例如 head /etc/passwd )。tail 命 令 显 示 文件 的 最 后 10 行 内 
容 (如 tail /etc/passwd )。 

你 可 以 使 用 -n 选 项 来 设置 显示 的 行 数 (例如: head -5 /etc/passwd )。 如 果 要 从 第 n 行 开始 显 
示 所 有 内 容 ， 使 用 tail +n。 


2.5.8 sort 命令 


sort 命 令 将 文件 内 的 所 有 行 按照 字母 顺序 快速 排序 。 你 可 以 使 用 -n 选 项 按照 数字 顺序 排序 那 
些 以 数字 开头 的 行 。 使 用 -r 选 项 反 向 排序 。 
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2.6 更 改 密码 和 shell 


你 可 以 使 用 passwd 命 令 来 更 改 密码 ， 你 需要 输入 一 遍 你 的 旧 密 码 和 两 遍 新 密码 。 密 码 最 好 复 
杂 一 些 ,， 不 要 使 用 简单 的 词句 ， 最 好 是 数字 、 大 小 写字 母 和 特殊 字符 混合 。 

设置 密码 的 一 个 好 方法 是 选择 一 个 你 能 记 住 的 短 句 ， 将 其 中 的 某 些 字符 替换 为 数字 和 标点 ， 
然后 将 这 个 密码 记 牢 。 

你 可 以 用 chsh 命 令 更 改 shell ( 如 改 为 ksh 或 tcsh )。 本 书 默 认 使 用 的 shell 是 bash。 


2.7 dot 文件 


现在 跳 转 到 你 的 home 目 录 ， 分 别 运 行 1s 和 1s -a 两 个 命令 ， 你 应 该 能 够 注意 到 一 些 区 别 。 如 
果 没 有 -a 选项 ， 你 无 法 看 到 那些 叫 作 dot 文 件 的 配置 文件 ， 这 些 文件 以 .开头 。 常 见 的 dot 文 件 
有 .bashrc 和 .login， 还 有 以 .开头 的 dot 目 录 ， 如 .ssh。 

这 些 dot 文 件 没 有 什么 特别 之 处 。 有 些 命令 不 显示 它们 是 为 了 让 你 的 个 人 主 目录 显得 更 简洁 。 
例如 ， 除 非 使 用 -a 选项 ， 否 则 1s 命 令 不 显示 dot 文 件 。 此 外 ，shell 通 配 符 不 匹配 dot 文 件 ， 除 非 明 
确 指定 .*。 


注解 ”在 通配符 中 使 用 .* 可 能 会 导致 一 些 问 题 ， 因 为 .* 匹 配 . 和 .. (当前 目录 和 上 级 目录 )。 你 
可 以 使 用 正则 表达 式 .[^.]* 或 .??* 来 排除 这 两 个 目录 。 


2.8 环境 变量 和 shell 变量 


shel 中 可 以 保存 一 些 临时 变量 ， 称 作 shell 变 量 ， 它 们 是 一 些 字符 值 。shell 变 量 可 以 保存 脚本 
执行 过 程 中 的 数据 ， 一 些 shell 变 量 用 来 控制 shell 的 运行 方式 (例如 ，bash shell 在 显示 提示 符 前 会 
读 取 变量 PS1 的 值 ， 如 果 PS1 变 量 中 有 内 容 ， 则 将 它 看 作 提示 符 )。 

我 们 使 用 等 号 = 为 shell 变 量 赋值 ， 例 如 : 


$ STUFF=blah 


以 上 命令 将 blah 赋 值 给 变量 STUFF。 我 们 使 用 $STUFF 来 获得 该 变量 的 值 ( 例如， 尝试 一 下 echo 
$STUFF 这 个 命令 )。 我 们 将 在 第 11 章 介绍 更 多 的 shell 变 量 。 

环境 变量 和 shell 变 量 类 似 ， 但 其 不 仅仅 针对 shell。Unix 系 统 中 所 有 的 进程 都 能 够 访问 环境 变 
量 。 两 者 最 大 的 区 别 是 shell 变 量 只 能 被 当前 的 shell 访 问 ， 在 shell 中 运行 的 命令 则 无 法 访问 。 而 环 
境 变量 能 够 被 shell 中 运行 的 所 有 进程 访问 。 

环境 变量 可 以 通过 export 命 令 来 设置 。 例 如 ， 如 果 想 将 shell 变 量 $STUFF 变 成 环境 变量 ， 可 以 
执行 如 下 命令 : 
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$ STUFF=blah 
$ export STUFF 


许多 程序 使 用 环境 变量 作为 配置 和 选项 信息 。 例 如 ， 你 可 以 使 用 LEss 这 个 环境 变量 来 配置 ce 
less 命 令 的 参数 (许多 命令 的 帮助 手册 里 都 有 ENVIRONMENT 这 一 节 ， 教 你 如 何 使 用 环境 变量 
来 设置 该 命令 的 参数 和 选项 )。 


2.9 命令 路 径 


PATH 是 一 个 特殊 的 环境 变量 ， 它 定义 了 命令 路 径 ， 或 简称 为 路 径 。 命 令 路 径 是 一 个 系统 目录 
列表 ，shell 在 执行 一 个 命令 的 时 候 ， 会 去 这 些 目录 中 查找 这 个 命令 。 比 如 : 运行 1s 命 令 时 ，shell 
会 在 PATH 中 定义 的 所 有 目录 里 查找 1s, 如 果 1s 出 现在 多 个 目录 中 , shell 会 运行 第 一 个 匹配 的 程序 。 

如 果 你 运行 echo $PATH， 你 会 看 到 所 有 的 路 径 组 件 ， 它 们 之 间 以 冒号 ( : ) 分 隔 。 例 如 : 


$ echo $PATH 
/usr/local/bin:/usr/bin:/bin 


你 可 以 设置 PATH 变量 ， 为 shell 查 找 命令 加 入 更 多 的 路 径 。 例 如 ,使 用 以 下 命令 可 以 将 路 径 dir 
加 入 到 PATH 的 最 前 面 ， 这 样 shell 会 先 查 找 dit 路 径 ， 然 后 再 查找 其 他 路 径 : 


$ PATH=d7i7: $PATH 


你 也 可 以 将 路 径 加 入 到 PATH 变量 的 最 后 面 ， 这 样 shell 会 最 后 查找 dir 路 径 : 


$ PATH=$PATH: dzz 


注解 ”在 更 改 PATH 时 需要 特别 小 心 ， 因 为 你 有 可 能 会 不 小 心 将 PATH 中 所 有 的 路 径 删 除 掉 。 不 过 
也 不 用 大 担心 ， 你 只 需要 启动 一 个 新 的 shell 就 可 以 找 回 原来 的 PATH。 最 简单 的 解决 办 法 
是 关闭 当前 的 终端 窗口 并 启动 一 个 新 的 窗口 。 


2.10 ”特殊 字符 


在 谈论 Linux 的 时 候 ， 我 们 需要 了 解 一 些 术 语 。 如 果 你 有 兴趣 了 解 ， 可 参考 “Jargon File” 
( http://www.catb.org/jargon/html/ ) 或 者 它 的 印刷 版 本 The New Hackers Dictionary ( MIT Press， 
1996 )。 

表 2-1 列 出 了 一 些 特殊 字符 ， 其 中 很 多 本 章 已 经 介绍 过 。 一些 工具 ， 比 如 Perl 编 程 语言 ， 用 到 
几乎 所 有 这 些 特殊 字符 ! (请 注意 这 里 使 用 的 字符 名 称 是 美国 英语 名 称 。) 
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字 符 名 称 用 途 
星 号 正则 表达 式 ， 通 用 字符 
: 句点 当前 目录 ,文件 /主机 名 的 分 隔 符 
感叹 号 逻辑 非 运 算 符 ， 命 令 历史 
| 管道 命令 管道 
/ 斜 线 目录 分 隔 符 ， 搜 索 命令 
\ 反 斜 线 常量 ， 宏 ( 非 目录 ) 
$ 美元 符号 变量 符号 ， 行 尾 
单 引号 字符 串 常量 
反 引 号 命令 替换 
双 引 号 半 字 符 串 常量 
脱 字符 逻辑 非 运算 符 ， 行头 
波浪 字符 逻辑 非 运算 符 ， 目 录 快 捷 方式 
# 井 号 注释 ， 预 处 理 ， 替 换 
[] 方 括号 范围 
{} 大 括号 声明 块 ， 范 围 
下 划 线 空格 的 简易 替代 


注解 ”控制 键 我 们 通常 用 ^ 来 表示 ， 如 ^C 代 表 CTRL-C。 


2.11 命令 行 编辑 

在 使 用 shell 时 ， 你 应 该 能 注意 到 可 以 使 用 左右 箭头 来 编辑 命令 行 , 并且 通过 上 下 箭头 来 查看 
之 前 的 命令 。 这 是 Linux 系 统 的 标准 操作 。 

但 使 用 ctrl 键 来 代替 箭头 键 会 更 加 方便 。 表 2-2 中 的 命令 是 Unix 系 统 的 文本 编辑 标准 命令 ， 掌 
握 了 这 些 ， 你 就 可 以 很 方便 地 在 任何 Unix 系 统 中 编辑 文本 。 


表 2-2 ”命令 行 按键 


按键 操 作 
CTRL-B 左 移 光 标 

CTRL-F 右 移 光标 

CTRL-P 查看 上 一 条 命令 (或 上 移 光 标 ) 
CTRL-N 查看 下 一 条 命令 (或 下 移 光标 ) 
CTRL-A 移动 光标 至 行 首 

CTRL-E 移动 光标 至 行 尾 

CTRL-W I 除 前 一 个 词 

CTRL-U I 除 从 光标 至 行 首 的 内 容 
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( 续 ) 
按键 操 ” 作 
CTRL-K 删除 从 光标 至 行 尾 的 内 容 
CTRL-Y 粘贴 已 删除 的 文本 〈 例 如 粘贴 CTRL-U 所 删除 的 内 容 ) 


2.12 文本 编辑 器 


说 到 文本 编辑 ,不 得 不 提 文 本 编辑 器 。 要 用 好 Unix ,你 必须 能 够 编辑 文本 文件 并 旦 不 对 其 
成 损坏 。Unix 系 统 使 用 纯 文本 文件 来 保存 配置 信息 ( 如 目录 /etc 中 的 文件 )。 编辑 文件 并 不 是 难 习 
但 由 于 要 经 常 性 地 编辑 这 些 文件 ， 因 此 你 需要 一 个 强大 的 文本 编辑 器 。 

在 众多 文本 编辑 器 中 ， 你 需要 掌握 vi 和 Emacs 二 者 之 一 ， 它 们 是 Unix 系 统 中 约定 俗 成 所 用 的 
标准 编辑 器 。 很 多 Unix 的 配置 向 导 对 编辑 器 的 选择 很 挑剔 , 但 是 没关系 ,你 可 以 自己 选择 ,选择 
标准 就 是 它 对 你 而 言 合 不 合适 。 

口 如 果 你 想 要 一 个 万 能 的 编辑 器 ， 功 能 强大 ， 有 在 线 帮 助 ， 你 可 以 试 试 Emacs。 不 过 它 需 要 
你 进行 一 些 额 外 的 手动 编辑 。 
口 如 果 想 要 高 效 快速 ， 那 么 vi 比较 适合 你 。 

有 关 vi 的 详细 知识 可 以 参考 这 本 书 : Learning the vi and Vim Editors: Unix Text Processing, 7th 
edition ( O’Reilly，2008 )。 关 于 Emacs 你 可 以 参考 在 线 文档 Start Emacs: 打开 Emacs， 按 CTRL-H， 
然后 按 T， 或 者 参考 GNU Emacs Manual ( Free Software Foundation，2011 )。 

其 他 的 编辑 器 如 Pico 和 myriad GUI editor 可 能 界面 会 更 加 友好 一 些 ， 但 是 你 一 旦 习惯 了 vi 和 
Emacs 以 后 ， 也 许 就 再 也 不 想 使 用 它们 了 。 


A 
JEL 
三 
冉 ， 


注解 ”你 在 进行 文本 编辑 的 时 候 ， 可 能 第 一 次 注意 到 了 终端 界面 和 GUI 的 区 别 。vi 这 样 的 编辑 器 
运行 在 终端 窗口 中 ， 使 用 标准 输入 输出 界面 。GUI 编 辑 器 启动 自己 的 窗口 并 有 自己 的 窗 
口 界面 ， 与 终端 窗口 是 相互 独立 的 。Emacs 既 有 终端 界面 也 有 图 形 界 面 。 


2.13 ”获取 在 线 帮 助 


Linux 系 统 的 帮助 文档 非常 丰富 。 帮 助手 册 提 供 命令 的 使 用 说 明 。 比 如 你 若是 想 了 解 1s 命 令 
的 用 法 ， 只 需 运行 : 


$ man ls 


帮助 手册 旨 在 提供 基础 知识 和 参考 信息 ， 有 时 会 有 一 些 实例 和 交叉 索引 ，, 但 是 基本 没有 那 种 
教程 式 的 文档 。 
帮助 手册 会 按 系 统 排序 方式 ( 如 按照 字母 顺序 ) 列 出 命令 的 所 有 选项 , 但 是 不 会 突出 重点 ( 比 
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如 那些 经 常 被 使 用 的 选项 )。 如 果 你 有 足够 的 耐性 ， 可 以 逐个 尝试 , 或 者 可 以 问 别 人 。 
下 面 的 命令 可 以 帮 你 借助 关键 字 来 查找 相关 帮助 手册 : 


$ man -k keyword 


如 果 你 只 知道 某 个 功能 ,但 是 不 知道 命令 名 ,你 可 以 很 方便 地 通过 关键 字 来 查找 。 比 如 你 若 


想 使 用 排序 功能 ， 就 可 以 运行 下 面 的 命令 来 列 出 所 有 和 排序 有 关 的 命令 : 


$ man -k sort 
-- Snip-- 


comm (1) - compare two sorted files line by line 
qsort (3) - sorts an array 

sort (1) - sort lines of text files 

sortm (1) - Sort messages 

tsort (1) - perform topological sort 

-- Snip-- 


输出 结果 包括 帮助 手册 的 名 称 、 所 属 的 章节 以 及 内 容 的 简要 描述 。 


注解 ”如 果 你 对 本 书目 前 介绍 的 命令 有 疑问 ， 可 以 使 用 man 命 令 查阅 它们 的 帮助 手册 。 


帮助 手册 按照 命令 类 型 被 组 织 为 很 多 个 章节 ， 章 节 编 号 出 现在 章节 名 后 面 的 括号 中 ， 例 如 
ping(8)。 表 2-3 中 列 出 了 各 章节 和 它们 的 编号 。 
表 2-3 在线 帮助 手册 章节 列表 
划一 亿 简介 
1 用 户 命令 
2 系统 调用 
3 Unix 高 级 编程 库 文档 
4 设备 接口 和 设备 驱动 程序 信息 
5 文件 描述 符 (系统 配置 文件 ) 
6 游戏 
7 文件 格式 、 规 范 和 编码 (ASCI[ 编 码 和 文件 后 缀 等 等 ) 
8 系统 命令 和 服务 器 
章节 1、5、7 和 8 对 本 书 的 内 容 是 很 好 的 补充 参考 。 章 节 4 用 到 的 不 多 , 章节 6 的 内 容 稍 微 有 些 


单薄 。 音 节 3 主 要 是 供 开 发 人 员 人 参考。 在 阅读 完 本 书 有 关系 统 调 用 的 部 分 后 ， 你 能 对 章节 2 的 内 容 


有 更 好 的 理解 。 
你 可 以 按 序号 来 选择 章节 ,这 会 让 搜索 结果 更 加 精确 ,因为 一 旦 匹配 了 搜索 关键 字 ， 


帮助 手 


册 会 定位 到 该 关键 字 查 找 结果 的 第 一 页 。 比 如 你 要 搜索 有 关 passwd 的 信息 ， 可 以 使 用 如 下 命令 : 
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$ man 5 passwd 


帮助 手册 涵盖 的 是 基本 内 容 , 你 还 可 以 使 用 --help 或 者 -h 选 项 来 获得 帮助 信息 。 如 1s --help。 
GNU 项 目 因为 不 喜欢 帮助 手册 这 种 方式 ， 引 入 了 info (或 者 texinfo )。info 文 档 的 内 容 更 加 丰 
富 ， 同 时 也 更 复杂 一 些 。 可 以 使 用 info 命 令 查看 info 文 件 内 容 : 


$ info command 


有 一 些 程序 将 它们 的 文档 放 到 目录 /usrshare/doc 中 ， 而 不 是 man 和 jinfo 里 。 你 可 以 在 这 里 搜索 
需要 的 文档 ， 当 然 别 忘 了 还 有 互联 网 。 


2.14 ”shell 输 入 输出 


至 此 你 已 经 了 解 了 Unix 的 基本 命令 , 文件 和 目录 , 现在 我 们 可 以 介绍 标准 输入 输出 的 重 定向 
了 。 让 我 们 从 标准 输出 开始 。 
如 果 想 将 命令 的 执行 结果 输出 到 文件 ( 默认 是 终端 屏幕 )， 可 以 使 用 重 定向 字符 >: 


$ command > file 


如 果 文 件 file 不 存在 ，shell 会 创建 一 个 新 文件 fle。 如 果 file 文 件 已 经 存在 ，shell 会 先 清空 文件 
的 内 容 。( 一 些 shell 可 以 通过 设置 参数 来 防止 文件 被 清空 ， 如 : bash 中 的 set -命令 。) 
如 果 不 想 把 原文 件 覆 盖 ， 你 可 以 使 用 >> 将 命令 的 输出 结果 加 入 到 文件 未 尾 : 


$ command >》 file 


这 个 方法 在 收集 


多 个 命令 的 执行 结果 时 非常 有 用 。 
你 还 可 以 使 用 管道 字符 ( 


1) 将 一 个 命令 的 执行 结果 输出 到 另 一 个 命令 。 例 如 : 


$ head /proc/cpuinfo 
$ head /proc/cpuinfo | tr a-z A-Z 


你 可 以 使 用 任意 多 个 管道 字符 ， 只 需要 在 每 个 额外 的 命令 前 各 加 一 个 管道 符 即 可 。 


2.14.1 标准 错误 输出 

有 的 时 候 你 会 发 现 ， 即 使 重 定向 了 标准 输出 ,终端 屏幕 上 还 是 会 显示 一 些 信息 ， 其实 这 是 标 
准 错误 输出 ， 是 用 来 显示 系统 错误 和 调试 信息 的 一 种 额外 的 输出 流 。 比 如 ， 运 行 下 面 的 命令 后 ， 
会 发 生 错误 : 


$ 1s /FFFFFFFFF > f 
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输出 完成 后 ，f 详 该 是 空 的 ， 但 你 会 在 终端 屏幕 上 看 到 以 下 错误 信息 ， 即 标准 错误 输出 : 


ls: cannot access /fffffffff: No such file or directory 


如 果 有 必要 ， 你 可 以 使 用 2> 重 定向 标准 错误 输出 ， 例 如 ， 使 用 2> 向 { 发 送 标准 输出 ， 向 e 发 送 
标准 错误 输出 : 


$ 1s /fffffffff > f 2》e 


这 里 的 ?是 由 shell 修 改 的 流 ID ，1 是 标准 输出 ，? 是 标准 错误 输出 。 
你 也 可 以 使 用 >8 将 标准 输出 和 标准 错误 输出 重 定向 到 同一 个 地 方 , 例如 ,把 标准 输出 和 标准 
错误 输出 重 定 向 到 文件 f 中 ， 可 执行 以 下 命令 : 


$ 1s /fffffffff 》f 2>81 


2.14.2 ”标准 输入 重 定向 
使 用 < 操作 符 将 文件 内 容重 定向 为 命令 的 标准 输入 : 


$ head < /proc/cpuinfo 


你 偶尔 会 遇见 要 求 这 种 类 型 的 重 定向 的 程序 ， 但 因为 很 多 Unix 命 令 可 以 使 用 文件 名 作为 参 
数 ， 所 以 不 太 常 需要 使 用 < 来 重 定向 文件 。 例 如 ， 上 述 命令 也 可 以 写成 head /proc/cpuinfo。 


2.15 ”理解 错误 信息 

在 Linux 这 样 的 基于 Unix 的 操作 系统 中 ， 程 序 运行 出 错时 你 要 做 的 第 一 件 事情 必须 是 查看 错 
误 信 息 ， 因 为 大 多 数 情 况 下 ， 出错 的 具体 原因 都 能 在 错误 信息 里 找到 。 这 一 点 Unix 系 统 做 得 比 其 
他 有 些 操作 系统 要 好 。 
2.15.1 解析 Unix 的 错误 信息 


绝 大 部 分 Unix 上 的 应 用 程序 都 使 用 相同 的 方式 处 理 错 误 信 息 , 但 在 任意 两 个 程序 的 输出 结果 
之 间 可 能 会 存在 些微 的 差别 。 例 如 ， 你 可 能 会 经 常 遇 到 这 种 情况 : 


$ ls /dsafsda 
ls: cannot access /dsafsda: No such file or directory 


该 信息 分 为 以 下 三 部 分 。 
口 命令 文件 名 : 1s。 一 些 程序 不 显示 命令 文件 名 ， 这 对 于 脚本 调试 来 说 很 不 方便 。 但 这 也 
不 是 问题 的 关键 。 
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口 文件 路 径 : /dsafsda。 这 是 一 条 更 为 具体 的 信息 ， o 
口 错误 信息 : No such file or directory。 这 一 信息 告诉 我 们 错误 出 在 文件 路 径 名 上 。 
将 以 上 的 信息 综合 起 来 看 ， 你 就 能 得 出 结论 : 1s 想 要 访问 文件 /dsafsda， 但 是 文件 不 存在 。 
在 这 个 例子 里 , 错误 信息 很 易 懂 , 但 是 如 果 你 运行 的 是 执行 很 多 命令 的 脚本 ,出 错 信息 会 变 
杂 难 懂 。 


人 日 全 
局 会 父 伍 恬 


而 问题 就 出 在 这 个 文件 路 径 上 


在 排 错时 , 务必 从 第 一 个 错误 开始 入 手 。 程序 报告 错误 时 总 
作 ， 接 下 来 告诉 你 一 些 其 他 的 相关 问 


是 先 告诉 你 它 无 法 完成 菜 一 个 操 


题 。 例 如 我 们 虚构 这 样 一 个 场景 : 


scumd: cannot access /etc/scumd/config: No such file or directory 
后 面 跟着 一 大 串 的 错误 信息 


， 看 起 来 问题 很 严重 。 首 先 不 要 受 它 们 的 影响 ,专注 于 第 
号 你 就 知道 ， 要 解决 的 问题 只 不 过 是 创建 


误 信 息 


一 个 错 

个 文件 /etc/scumd/config 而 已 
注解 ”不 要 把 错误 信息 和 警告 
我 们 程序 出 了 问题 ， 


ee 


告 信息 看 起 来 像 是 错误 信息 ， 但 


是 它 只 是 告诉 
够 继 和 Ve 息 里 面 的 问题 ， 你 可 能 需要 终 
止 当前 进程 。( 有 关 查 看 和 终止 进程 的 内 


， 我 们 将 在 2.16 节 介绍 。) 


2.15.2 ”常见 错误 


Unix 程 序 的 很 多 错误 与 文件 和 进程 有 关 。 下 面 我 们 列举 一 些 常 见 的 错误 。 


No such file or directory 


这 可 能 是 我 们 最 常 遇 到 的 错误 : 访问 一 个 不 存在 的 文件 或 目录 。 由 于 Unix 的 IO 系统 对 文件 


和 目录 不 做 区 分 , 所 以 当 你 试图 访问 一 个 不 存在 的 文件 ,进入 一 个 不 存在 的 目录 , 或 将 文件 写 人 
一 个 不 存在 的 目录 时 ， 都 会 出 现 这 个 错误 。 
File exists 


如 果 新 建文 件 的 名 称 和 现 有 的 文件 或 者 目录 重 名 ， 就 会 出 现 这 个 错误 。 
Not a directory, ls a directory 
这 个 错误 出 现在 当 你 把 文件 当 作 目 录 或 者 反之 ， 提 


巴 目 录 当 作文 件 。 例 如 : 
$ touch a 
$ touch a/b 
touch: a/b: Not a directory 


错误 出 在 第 二 个 命令 这 里 ， 将 文件 4 当 作 了 目录 ， 很 多 时 候 你 可 
路 径 。 


要 花 点 时 间 来 检查 文件 
No space left on device 
说 明 硬 盘 空 间 不 足 。 
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Permission denied 

当 你 试图 读 或 写 一 个 没有 访问 权限 的 文件 或 目录 时 , 会 遇 到 这 个 错误 。 当 你 试图 执行 一 个 你 
无 权 执行 ( 即使 你 有 读 的 权限 ) 的 文件 时 也 会 出 现 这 个 错误 。 我 们 会 在 2.17 节 详细 介绍 。 

Operation not permitted 

当 你 试图 终止 一 个 你 无 权 终止 的 进程 时 ， 会 出 现 这 个 错误 。 

Segmentation fault, Bus error 

分 段 故障 ， 总 线 错 误 。 分 段 故障 这 个 错误 通常 是 告诉 你 ,你 运行 的 程序 出 了 问题 。 可 能 你 的 
程序 试图 访问 它 无 权 访问 的 内 存 空间 , 这 时 操作 系统 就 会 将 其 终止 。 总 线 错误 说 明 你 的 程序 访问 
内 存 的 方式 有 问题 。 遇 到 这 类 错误 通常 是 因为 程序 的 输入 数据 有 问题 。 


2.16 ”查看 和 操纵 进程 


我 们 在 第 1 章 介绍 过 ， 进 程 就 是 运行 在 内 存 中 的 程序 。 每 个 进程 都 有 一 个 数字 ID ， 叫 进程 ID 
( Process ID ， 以 下 简称 PID )。 可 以 使 用 ps 命令 列 出 所 有 正在 运行 的 进程 : 


$ ps 

PID TTY STAT TIME COMMAND 

520 po Ss 0:00 -bash 

545 ? 9 3:59 /usr/X11R6/bin/ctwm -W 

548 ? 5S 0:10 xclock -geometry -0-0 
2159 pd SW 0:00 /usr/bin/vi lib/addresses 
31956 p3 R 0:00 ps 


每 行 的 字段 依次 代表 以 下 内 容 。 

PID: 进程 ID。 

TTY: 进程 所 在 的 终端 设备 ， 稍 后 详 述 。 

STAT: 进程 状态 ， 就 是 进程 在 内 存 中 的 状态 。 例 如 ，5$ 表 示 进 程 正 在 休眠 ，R 表 示 进 程 正 在 运 
行 。( 完整 的 状态 列表 请 参阅 帮助 手册 ps(1)。) 

TIME: 进程 目前 为 止 所 用 CPU 时 长 〈 格 式 : mm:ss )， 就 是 进程 占用 CPU 的 总 时 长 。 

COMMAND : 命令 名 ， 请 注意 进程 有 可 能 将 其 由 初始 值 改 为 其 他 。 


2.16.1 命令 选项 


ps 命令 有 很 多 选项 , 你 可 以 使 用 三 种 方式 来 设置 选项 : Unix 方 式 、BSD 方 式 和 和 GNU 方式 。 BSD 
方式 被 认为 是 比较 好 的 一 种 ， 因 为 它 相 对 简单 一 些 。 本 书 也 将 使 用 BSD 这 种 方式 。 下 面 是 一 些 比 
较 实 用 的 选项 组 合 。 

ps x ”显示 当前 用 户 运 行 的 所 有 进程 。 

ps ax 显示 系统 当前 运行 的 所 有 进程 ， 包 括 其 他 用 户 的 进程 。 

ps u ”显示 更 详细 的 进程 信息 。 

ps w ”显示 命令 的 全 名 ， 而 非 仅 显示 一 行 以 内 的 内 容 。 
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和 对 其 他 程序 一 样 ， 你 可 以 对 ps 使 用 选项 组 合 ， 如 ps aux 和 ps auxw。 你 可 以 将 PID 作 为 ps 命 
令 的 一 个 参数 , 用 来 查看 该 特定 进程 的 信息 , 如 ps u $$, 其 中 $$ 是 一 个 shell 变 量 , 表示 当前 的 shell 
进程 。( 在 第 8 章 我 们 将 会 介绍 top 和 1sof 管 理 员 命令 ， 它 们 能 够 帮助 我 们 找到 进程 所 在 的 位 置 。) 


2.16.2 ”终止 进程 


要 终止 一 个 进程 ， 可 以 使 用 kill1 命 令 向 其 发 送 一 个 信号 。 当 kill 命 令 运 行 时 ， 它 请 求 内 核发 
送 一 个 信号 给 进程 。 大 多 数 情 况 下 ， 你 可 以 执行 下 面 的 命令 : 


$ kill pid 


言 号 的 种 类 有 很 多 ， 默 认 是 TERM (或 者 terminate )。 你 可 以 设置 选项 来 发 送 不 同类 型 的 信号 。 
例如 ， 发 送 STOP 信 和 号 可 以 让 进程 暂停 ， 而 不 是 终止 : 


$ kil1 -STOP pid 


被 暂停 的 进程 仍然 驻 留 在 内 存 ， 等 待 被 继续 执行 。 使 用 CONT 信 号 可 以 继续 执行 进程 : 


$ kil1 -CONT pid 


注解 ”你 可 以 使 用 CTRL-C 来 终止 当前 运行 的 进程 ， 效 果 和 kill] -INT 命 令 一 样 。 


终止 进程 最 粗鲁 的 一 种 方式 是 使 用 KILL 信 号 。 和 其 他 信号 不 同 ，KILL 会 强行 终止 进程 ， 并 将 
其 移出 内 存 ， 不 会 给 进程 清理 和 收尾 的 机 会 。 不 到 万 不 得 已 最 好 不 要 使 用 该 信号 。 

不 要 随便 终止 一 个 你 不 知道 的 进程 ， 不 然 很 有 可 能 遇 到 麻烦 。 

你 还 可 以 使 用 数字 来 代替 信号 名 ， 例 如 : kill -9 等 同 于 kill -KILL。 因 为 内 核 使 用 数字 来 代 
表 不 同 的 信号 。 如 果 你 知道 你 想 要 发 送 的 信和 号 的 数字 号 ， 可 以 使 用 这 种 方式 。 


2.16.3 ”任务 控制 


Shell 也 支持 任务 控制 (Job Control )， 是 通过 不 同 的 按键 和 命令 向 进程 发 送 TSTP (类似 STOP ) 
和 CONT 信 和 号 的 一 种 方式 。 例 如 ， 你 可 以 使 用 CTRL-Z 发 送 TSTP 信 和 号 来 停止 进程 ， 然 后 键 人 fg (将 
进程 置 于 前 台 ) 或 者 bg (将 进程 移入 后 台 ， 见 下 一 小 节 ) 继续 运行 进程 。 对 初学 者 来 说 这 些 可 能 
不 太 好 理解 ,不 过 对 于 很 多 高 级 用 户 来 说 它们 是 很 好 用 的 命令 。 如 果 使 用 CTRL-Z 而 不 是 CTRL-C， 
然后 置之不理 ， 最 终 会 形成 大 量 处 于 暂停 状态 的 进程 。 


提示 你 可 以 使 用 jobs 命 令 来 查看 你 暂停 了 哪些 进程 。 
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如 果 你 想 要 运行 多 个 shell, 可 以 单独 在 每 个 终端 窗口 中 运行 一 个 程序 , 将 非 交 互 性 质 的 程序 
置 于 后 台 运行 〈 后 面 将 会 介绍 ), 或 者 了 解 一 下 screen 程 序 的 使 用 方法 。 


2.16.4 ”后台 进程 


当 你 在 shell 上 运行 命令 时 , 命令 行 提示 符 会 暂时 消失 , 命令 结束 时 又 重新 显示 。 你 可 以 使 用 
及 操作 符 将 进程 设置 为 后 台 运行 ,这样 提 示 符 会 一 直 显 示 ， 你 在 进程 运行 过 程 中 可 以 继续 其 他 操 
作 。 例 如 ， 如 果 你 要 解压 缩 一 个 很 大 的 文件 〈 我 们 将 在 2.18 节 介绍 )， 同 时 又 不 想 干 等 执行 结果 ， 
你 就 可 以 使 用 下 面 的 命令 : 


$ gunzip file.gz & 


Shell 会 显示 后 台新 进程 的 PID ， 然 后 直接 将 命令 行 提 示 符 显示 回来 ， 以 便 你 继续 进行 其 他 操 
作 。 后 台 进 程 在 你 退出 系统 后 仍 会 一 直 运 行 ， 这 比较 适用 于 那些 耗 时 很 长 的 进程 。( 你 可 以 设置 
shell 让 进程 在 结束 时 发 送 通知 。) 

后 台 进 程 的 一 个 缺点 是 没 法 和 用 户 交 互 (甚至 会 直接 从 终端 获得 输入 )。 它 们 可 以 暂停 (用 
fg 恢复 运行 ) 或 终止 以 便 从 标准 输入 获得 数据 ， 也 可 以 将 数据 输出 到 标准 输出 和 标准 错误 ， 这些 
数据 显示 在 终端 屏幕 上 ,有 时 会 和 其 他 正在 运行 的 进程 的 输出 数据 混在 一 起 显示 ,让 人 难以 辨别 。 

最 好 的 方式 是 将 输出 重 定向 (输入 也 可 以 ), 比如 重 定向 到 文件 或 别 的 地 方 ( 我 们 已 经 在 2.14 
节 介 绍 过 )， 这 样 屏 幕 上 就 不 会 出 现 杂 乱 无 章 的 输出 数据 。 

如 果 后 台 进 程 的 输出 结果 杂乱 无 章 , 你 需要 知道 如 何 整理 你 的 终端 窗口 内 容 。bash shell 和 大 
多 数 有 全 屏 交 互 的 程序 支持 CTRL-L 命 令 ， 它 会 清空 你 的 屏幕 。 进 程 在 从 标准 输入 读 取 数据 之 前 ， 
经 常 先 使 用 CTRL-R 清 空当 前 行 ， 在 错误 的 时 间 按 了 错误 的 键 会 让 情况 更 糟 。 如 果 不 小 心 在 bash 
提示 符 下 按 了 CTRL-R, 你 会 被 切换 到 一 个 让 人 不 知 所 云 的 反 转 搜索 模式 , 这 时 你 可 以 按 ESC 退 出 。 


2.17 ”文件 模式 和 权限 


Unix 系 统 中 的 每 一 个 文件 都 有 一 组 权限 值 ， 用 来 控制 你 是 否 能 读 、 写 和 运行 文件 。 可 以 使 用 
命令 ls -1 来 查看 这 些 信息 。 例 如 : 


-IW-T--T--@@ 1 juser somegroup 7041 Mar 26 19:34 endnotes .htm] 


@ 是 文件 模式 ， 显 示 权 限 及 其 他 附加 信息 。 文 件 模式 由 四 部 分 组 成 ， 如 图 2-1。 


] 户 权限 
用 户 组 权限 
2 ea 


-IW-I--r-- 


图 2-1 文件 模式 信息 


图 灵 社 区 会 员 小 虎 (164142021@qq.com) 专 享 尊重 版 权 


2.17 文件 模式 和 权限 29 


本 例 中 第 一 个 字符 -是 文件 类 型 ，- 代 表 常 规 文件 ， 常 规 文件 是 最 常见 的 一 种 文件 类 型 ， 另 一 
种 常见 类 型 是 目录 ， 用 d 代 表 。( 3.1 节 中 会 介绍 其 余 的 文件 类 型 。) 

本 例 中 的 其 余部 分 是 文件 权限 信息 ， 由 三 部 分 组 成 : 用 户 、 用 户 组 和 其 他 。 例 如 ,rw- 是 用 
户 权 限 ， 后 面 的 r-- 是 用 户 组 权限 ， 最 后 的 r-- 是 其 他 权限 。 

权限 信息 由 四 个 字符 组 成 : 


r ”文件 可 读 

w ”文件 可 写 

x ”文件 可 执行 
无 


用 户 权 限 部 分 (第 一 组 ) 是 针对 文件 的 拥有 者 ， 上 例 中 是 juser。 用 户 组 权限 部 分 是 针对 
somegroup 这 个 用 户 组 中 的 所 有 用 户 。( 命令 groups 可 以 显示 你 所 在 的 用 户 组 , 详细 内 容 在 7.3.5 节 
介绍 。 ) 


其 他 权限 部 分 是 针对 系统 中 的 所 有 其 他 用 户 ， 又 称 为 全 局 权限 。 


注解 ”权限 信息 中 代表 读 、 写 和 执行 的 这 三 个 部 分 我 们 称 为 权限 位 ， 如 : 读 位 指 的 是 所 有 三 个 
代表 读 的 部 分 。 


有 些 可 执行 文件 的 执行 位 是 s (setuid ) 而 不 是 zx， 表示 你 将 以 文件 拥有 者 的 身份 运行 该 文件 ， 
而 不 是 你 自己 。 很 多 程序 使 用 s， 如 passwd 命 令 ， 因 为 该 命令 需要 更 新 /etc/passwd 文 件 ， 所 以 必须 
以 文件 拥有 者 ( 即 root 用 户 ) 的 身份 运行 。 


2.17.1 更 改 文件 权限 
使 用 chmod 命 令 更 改 文件 权限 。 例 如 ， 对 文件 fle， 要 为 用 户 组 g 和 其 他 用 户 o 加 上 可 读 权限 r， 


运行 以 下 命令 : 


$ chmod g+r file 
$ chmod o+r file 


也 可 以 使 用 一 行 命令 : 


$ chmod go+r file 


如 果 要 取消 权限 ， 则 使 用 go-r。 
注解 不 要 将 全 局 权限 设置 为 可 写 ， 因 为 这 样 任何 人 都 能 够 修改 文件 。 但 是 这 样 会 让 互联 网 上 


的 人 更 改 你 的 文件 吗 ? 恐怕 不 能 ， 除 非 你 的 系统 有 网 络 安全 漏洞 。 果 真是 这 样 的 话 ， 文 
件 权限 也 无 能 为 力 。 
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有 时 你 会 看 到 下 面 这 样 的 命令 ， 使 用 数字 来 代表 权限 : 


$ chmod 644 file 


这 个 命令 会 设置 所 有 的 权限 位 ,我 们 称 为 绝对 权限 设置 。 要 知道 每 一 个 数字 ( 八进制 ) 代表 
的 权限 ， 可 以 参考 该 命令 的 使 用 手册 。 请 参考 下 面 的 表格 。 


表 2-4 ”绝对 权限 模式 


模 式 详 情 用 途 
644 用 户 : 读 / 写 ， 用 户 组 ， 其 他 : 读 文件 
600 用 户 : 读 / 写 ， 用 户 组 ， 其 他 : 无 文件 
755 用 户 ; 读 / 写 / 执 行 ， 用户 组 ， 其 他 : 读 / 执 行 目录 ,程序 
700 用 户 : 读 / 写 /执行 ， 用户 组 ， 其 他 : 无 目录 ,程序 
711 用 户 : 读 / 写 /执行 ， 用户 组 ， 其 他 : 执行 目录 


和 文件 一 样 ， 目 录 也 有 权限 。 如 果 你 对 目录 有 读 的 权限 ， 你 就 可 以 列 出 目录 中 的 内 容 , 但 是 
如 果 要 访问 目录 中 的 某 个 文件 ， 你 就 必须 对 目录 有 可 执行 的 权限 〈 使 用 绝对 值 设 置 权限 的 时 候 ， 
目录 的 可 执行 权限 常常 会 被 不 小 心 取消 )。 

你 还 可 以 使 用 umask 命 令 来 为 文件 设置 预定 义 的 默认 权限 。 例 如 ， 如 果 你 想 让 任何 人 对 文件 
和 目录 有 读 的 权限 ,使 用 umask 022, 反 之， 如果 不 想 让 你 的 文件 和 目录 可 读 , 使 用 umask 077 (在 
第 13 章 中 我 们 将 详细 介绍 如 何在 启动 文件 中 使 用 umask 命 令 )。 


2.17.2 ”符号 链接 
符号 链接 是 指向 文件 或 者 目录 的 文件 ， 相 当 于 文件 的 别名 (类似 Windows 中 的 快捷 方式 )。 


符号 链接 为 复杂 的 目录 提供 了 便捷 快速 的 访问 方式 。 
在 一 个 长 目录 列表 里 ,符号 链接 如 下 例 所 示 ( 请 注意 文件 类 型 是 1 ): 


一 


lrwxrwxrwx 1 ruser users 11 Feb 27 13:52 somedir -> /home/origdir 


如 果 你 访问 somedir， 实 际 访问 的 是 hnome/origdir 目 录 ， 符 号 链接 仅仅 是 指向 另 一 个 名 字 的 名 
字 ， 所 以 /home/origdir 这 个 目录 即使 不 存在 也 没有 关系 。 

如 果 /home/origdir 不 存在 的 话 ， 访 问 somedir 的 时 候 系统 会 报错 称 somedir 不 存在 。 

符号 链接 不 提供 其 目标 路 径 的 详细 信息 , 你 只 能 自己 打开 这 个 链接 , 看 看 它 指向 的 究 竞 是 文 
件 还 是 目录 。 有 时 候 一 个 符号 链接 还 可 以 指向 另 一 个 符号 链接 ， 我 们 称 为 链 式 符号 链接 。 


2.17.3 创建 符号 链接 
使 用 ln -s 命 令 创建 符号 链接 ， 
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$ ln -s target linkname 


linkname 人 参数 是 符号 链接 名 称 ，target 参 数 是 要 指向 的 目标 路 径 ，-s 选 项 表示 这 是 一 个 符号 
链接 〈 请 见 稍 后 的 警告 部 分 )。 

运行 这 个 命令 之 前 请 反复 确认 ， 如 果 你 不 小 心 调换 了 target 和 linkname 这 两 个 参数 的 位 置 ， 
命令 变 成 了 : ln -s linkname target， 如 果 1linkname 这 个 路 径 已 经 存在 ,一些 有 趣 的 事情 就 会 发 
生 。1n 会 在 linkname 目 录 中 创建 一 个 名 为 target 的 符号 链接 ,如 果 1linkname 不 是 绝对 路 径 , target 
就 会 指向 它 自己 。 当 你 使 用 ln 命令 遇 到 问题 的 时 候 ， 请 注意 检查 此 类 情况 。 

如 果 不 知道 符号 链接 已 经 存在 的 话 ， 就 会 带 来 很 多 麻烦 。 例如, 你 有 可 能 无 意 中 会 将 符号 链 
接 文件 当 作 普 通 文件 进行 编辑 。 


警告 ”创建 符号 链接 的 时 候 , 请 注意 不 要 忘记 -s 选 项 。 没 有 此 选项 的 话 ，ln 命 令 会 创建 一 个 硬 
链接 ,为 文件 创建 一 个 新 的 名 字 。 新 文件 拥有 老 文件 的 所 有 状态 信息 ,和 符号 链接 一 样 ， 
打开 这 个 新 文件 会 直接 打开 文件 内 容 。 除 非 你 掌握 了 4.5 节 的 内 容 ， 否 则 不 要 使 用 符号 
链接 。 


符号 链接 能 方便 我 们 管理 、 组 织 、 共 享 文件 , 所 以 即使 有 这 么 多 “缺点 ”, 我 们 还 是 会 用 到 它 。 


2.18 “归档 和 压缩 文件 
了 解 了 文件 、 权 限 和 相关 错误 信息 之 后 ， 让 我 们 来 了 解 一 下 gzip 和 tar。 


2.18.1 gzip 命令 


gzip (GNU Zip ) 命令 是 Unix 上 众多 标准 压缩 程序 中 的 一 个 。GNU Zip 生 成 的 压缩 文件 带 有 
后 缀 名 .gz。 解 压缩 .gz 文件 使 用 gunzip file.gz 命 令 ， 压 缩 文件 使 用 gzip file 命 令 。 


2.18.2 tar 命令 


gzip 命 令 只 压缩 单个 文件 ， 要 压缩 和 归档 多 个 文件 和 目录 ， 可 以 使 用 tar 命 令 : 


$ tar cvf archive.tar file1 file2 ... 


tar 命 令 生 成 的 文件 带 有 后 缀 名 .tar，<archive>.tar 是 生成 的 归档 文件 名 ，filel1 、file2 等 是 要 归 
档 的 文件 和 目录 列表 。 选 项 c 代 表 创 建文 件 。 选 项 r 和 f 的 作用 则 更 加 具体 。 

选项 v 用 来 显示 详细 的 命令 执行 信息 比如 正在 归档 的 文件 和 目录 名 )， 再 加 一 个 v 选 项 可 以 
显示 文件 大 小 和 权限 等 信息 。 如 果 你 不 想 看 到 这 些 信 息 ， 可 以 不 用 加 v 选 项 。 

选项 f 代 表 文件 ， 后 面 需要 指定 一 个 归档 文件 名 〈 如 <archive>.tar )。 如 果 不 指定 归档 文件 名 ， 
则 归档 到 磁带 设备 ， 如 果 文 件 名 为 -, 则 是 归档 到 标准 输入 或 者 输出 。 
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解压 缩 tar 文 件 
使 用 tar 命 令 解压 缩 .tar 文 件 : 


$ tar xvf archive.tar 


选项 x 代表 解压 模式 。 你 还 可 以 只 解压 归档 文件 中 的 某 几 个 文件 ， 只 需要 在 命令 后 面 加 上 这 
些 文件 的 文件 名 即 可 。 


注解 ” tar 命令 解压 后 并 不 会 删除 归档 文件 。 


内 容 预 览 表 模式 

在 解压 一 个 归档 文件 之 前 , 通常 建议 使 用 选项 t 来 查看 归档 文件 中 的 内 容 , t 代 表 内 容 预 览 表 
模式 , 它 会 显示 归档 的 文件 列表 , 并 且 验 证 归档 信息 的 完整 性 。 如 果 你 不 做 检查 直接 解压 归档 文 
件 ， 有 时 会 解压 出 一 些 很 难 清理 的 垃圾 内 容 。 

你 需要 检查 压缩 包 中 的 文件 是 否 在 同一 目录 下 , 你 可 以 创建 一 个 临时 目录 , 在 其 中 试 着 解压 
一 下 看 看 。 

解压 缩 时 ， 你 可 以 使 用 选项 p 来 保留 被 归档 文件 的 权限 信息 。 当 你 使 用 超级 用 户 运 行 解压 命 
令 时 ,选项 p 默 认 开 局。 如果 你 在 执行 过 程 中 遇 到 这 样 那样 的 问题 ， 请 确保 你 等 到 tar 命 令 执行 完 
毕 并 显示 提示 符 。tar 命 令 每 次 都 处 理 整 个 归档 文件 ， 无 论 你 是 解压 整个 文件 或 者 只 是 文件 中 的 
某 部 分 , 所 以 命令 执行 过 程 中 请 不 要 中 断 ， 因 为 有 些 操作 是 在 文件 检查 之 后 才 开 始 的 ， 比 如 权限 


设置 。 
2.18.3 ”压缩 归档 文件 .tar.gz) 


许多 初学 者 对 被 压缩 后 的 归档 文件 ( 后 级 为 .tar.gz ) 比较 费解 。 我 们 可 以 按照 从 右 到 左 的 顺 
序 来 解压 和 打开 此 类 文件 。 例 如 ， 使 用 以 下 命令 首先 解压 缩 ， 然 后 校 验 及 释放 归档 文件 包 : 


$ gunzip file.tar.gz 
$ tar xvf file.tar 


如 果 需 要 归档 并 压缩 ， 则 按照 相反 顺序 ， 先 运行 tar 命 令 归 档 ， 然 后 运行 gzip 命 令 压缩 。 你 
可 能 会 逐渐 觉得 这 两 个 步骤 很 麻烦 ， 下 面 我 们 介绍 一 些 更 简便 的 方法 。 


2.18.4 ”zcat 命 令 


上 面 的 命令 缺点 是 执行 效率 不 高 ， 并 且 会 占用 很 多 硬盘 空间 。 管 道 命令 是 一 个 更 好 的 选择 ， 
例如 : 


$ zcat file.tar.gz | tar xvf - 
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zcat 命 令 等 同 于 gunzip -dc 命令 。 选 项 d 代 表 解 压缩 ， 选 项 c 代 表 将 运行 结果 输出 到 标准 输出 
(本 例 中 是 输出 到 tar 命 令 )。 

tar 命 令 很 常用 ， 它 的 Linux 版 本 有 这 样 几 个 选项 值得 注意 ; 选项 z 对 归档 文件 自动 运行 gzip， 
对 创建 归档 包 和 释放 归档 包 均 适用 。 例 如 使 用 以 下 命令 来 验证 压缩 文件 : 


$ tar ztvf file.tar.gz 


然而 ， 在 走 捷 径 以 前 ， 最 好 还 是 先 掌握 基本 方法 。 


注解 .tegz 文 件 和 .tar.gz 文 件 没 有 区 别 ， 后 缓 .tgz 主 要 是 针对 MS-DOS 的 FAT 文 件 系统 。 


2.18.5 ”其 他 的 压缩 命令 


Unix 中 的 另 一 个 压缩 命令 是 bzip2， 生 成 后 缀 名 为 .bz2 的 文件 。 该 命令 执行 效率 比 gzip 稍 慢 ， 
主要 用 来 压缩 文本 文件 ,因而 在 压缩 源 代码 文件 的 时 候 比 较 常 用 。 相 应 的 解压 缩 命 令 是 bunzip2， 
可 用 选项 和 gzip 几 乎 相同 ， 其 中 选项 j 是 针对 tar 命 令 的 压缩 和 解压 缩 。 

此 外 xz 是 另外 一 个 渐 受 欢迎 的 压缩 命令 ， 对 应 的 解压 缩 命 令 是 unxz， 可 用 选项 和 gzip 也 十 分 
类 似 。 

Linux 上 的 zip 和 unzip 与 Windows 上 的 .zip 文 件 格式 大 部 分 是 兼容 的 ， 包 括 .zip 和 .exe 自 解压 文 
件 。 有 一 个 很 古老 的 Unix 命 令 compress 支 持 .Z 格 式 ，gunzip 命 令 能 够 解压 缩 .Z 文 件 ， 但 是 gzip 不 
支持 此 格式 文件 的 创建 。 


2.19 ”Linux 目录 结构 基础 


我 们 前 面 介 绍 了 文件 、 目 录 和 帮助 手册 ， 现 在 来 看 看 系统 文件 。Linux 目 录 结 构 的 详解 可 以 
参考 文件 系统 标准 结构 ( FHS，http:/www.pathname.com/fhs/ )。 图 2-2 为 我 们 展示 了 Linux 的 基本 
目录 结构 ， 包 括 目 录 /、/usr 和 /var 下 的 子 目 录 。 请 注意 /sr 下 的 子 目 录 有 些 和 /下 的 子 目 录 一 样 。 


/ 


| bin/] [dev | | eto/| home/ [lib/| sbin/ [imp/| var/ 


bin/ | man/ li | local/ sbin/ share/ log/ | tmp/ | 


录 结 构 


图 2-2 Linux 
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下 面 这 些 目录 需要 重点 介绍 。 

口 "bin 目录 中 存放 的 是 可 执行 文件 ,包括 大 部 分 基础 的 Unix 命 令 (如 1s 和 cp )。 该 目录 中 的 

大 部 分 是 由 C 编 译 器 创建 的 二 进 制 文件 ， 还 有 一 些 现代 系统 的 shell 脚 本 文件 。 

D /dev 目 录 中 是 设备 文件 ， 将 在 第 3 章 详细 介绍 。 

口 /etc 目 录 ( 读 作 EHT-see ) 存放 重要 的 系统 配置 文件 ， 如 用 户 密码 文件 、 启 动 文件 、 设 备 、 
网 络 和 其 他 配置 文件 。 许 多 都 是 硬件 系统 的 配置 文件 。 例 如 ，/etc/X11 目 录 中 是 显示 卡 和 
视窗 系统 的 配置 文件 。 

口 ,home 目录 中 是 用 户 的 个 人 目录 。 大 多 数 Unix 系 统 都 遵循 这 个 规范 。 

D /lib 目 录 中 是 供 可 执行 程序 使 用 的 各 种 代码 库 。 代 码 库 分 为 两 种 : 静态 库 和 共享 库 。/lib 目 
录 中 一 般 只 有 共享 库 。 其 他 代码 库 目 录 ,， 如: msrlib 中 会 有 静态 库 和 动态 库 ， 以 及 其 他 的 
辅助 文件 〈 将 在 第 15 章 详细 介绍 )。 

口 /proc 目 录 中 通过 一 个 可 浏览 的 目录 与 文件 接口 来 存放 系统 相关 信息 ， 比 如 当前 运行 的 进 
程 和 内 核 的 信息 Linux 上 这 个 目录 的 一 大 部 分 子 目 录 结 构 相 比 其 他 Unix 系 统 要 特别 一 些 ， 
但 其 他 Unix 系 统 大 多 也 有 类 似 的 特性 。/proc 目 录 中 包含 了 当前 正在 运行 的 进程 的 信息 以 
及 一 些 内 核 参 数 。 

口 /sys 目 录 类 似 /proc 目 录 ， 里 面 是 设备 和 系统 的 信息 ( 将 在 第 3 章 介 绍 )。 

口 /sbin 目 录 中 是 可 执行 的 系统 文件 ， 这 些 可 执行 文件 用 来 管理 系统 。 普 通用 户 一 般 不 需要 

使 用 ， 许 多 命令 只 能 由 root 用 户 运 行 。 

口 /tmp 目 录 存 放 无 关 紧要 的 临时 文件 。 所 有 用 户 对 该 目录 都 有 读 和 写 的 权限 , 不 过 可 能 对 别 
人 的 文件 没有 权限 。 许 多 程序 会 使 用 这 个 目录 作为 保存 数据 的 地 方 ， 但 如 果 数 据 很 重要 
的 话 请 不 要 存放 在 /tmp 目 录 中 ， 因 为 很 多 系统 会 在 启动 时 清空 /mp 目录 ,其 至 是 经 常 性 地 
清理 这 个 目录 里 的 旧 文 件 。 也 注意 不 要 让 /tmp 目 录 里 的 垃圾 文件 占用 太 多 的 硬盘 空间 。 

口 usr 目录 虽 然 读 作 user， 但 里 面 并 没有 用 户 文件 ， 而 是 存放 着 许多 Linux 系 统 文 件 。/musr 目 录 
中 的 很 多 目录 名 和 root 目 录 上 的 相同 ( 如 /usr/bin 和 /usr/lib )， 里面 存放 的 文件 类 型 也 相同 。 
(为 了 让 root 文 件 系统 占用 尽 可 能 少 的 空间 ， 许 多 系统 文件 并 没有 存放 在 系统 root 目 录 下 。 ) 

口 /var 目 录 是 程序 存放 运行 时 信息 的 地 方 ， 如 系统 日 志 、 用 户 信 息 、 缓 存 和 其 他 信息 。( 你 
可 能 会 注意 到 这 里 有 一 个 子 目 录 /vartmp ， 和 /tmp 不 同 的 是 ， 系统 不 会 在 启动 时 清空 它 。) 


2.19.1 root 目录 下 的 其 他 目录 


root 目 录 下 还 有 以 下 这 些 子 目 录 。 

口 /boot 目 录 存 放 内 核 加 载 文件 。 这 些 文件 中 存放 Linux 在 第 一 次 启动 时 的 信息 ， 之 后 的 信息 
并 不 保存 在 这 里 。 详 见 第 5 章 。 

口 /media 目录 是 加 载 可 移 除 设备 的 地 方 ， 比 如 可 移动 硬盘 。 
口 /opt 目 录 一 般 存 放 第 三 方 软件 ， 许 多 系统 并 没有 这 个 目录 。 
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2.19.2 /usr 目录 


/usrt 目 录 中 内 容 比 它 的 名 字 多 得 多 , 你 看 一 看 /msr/bin 和 /usr/lib 的 内 容 就 会 知道 ，/usr 目 录 存 放 

那些 运行 在 用 户 空 间 中 的 进程 和 数据 。 除 了 /sr/bin、/sr/sbin1 和 /usr/lib 处 ， 还 包括 以 下 内 容 。 

口 /include 目 录 存 放 C 编 译 右 需要 使 用 的 头 文 件 。 

口 /info 目 录 存 放 GNU 帮 助手 册 ( 参考 2.13 节 )。 

口 /local 目 录 是 管理 员 安 装 软件 的 地 方 ， 它 的 结构 和 /以 及 /sr 类 似 。 

口 ,man 存放 用 户 手册 。 

口 /share 目 录 存 放 Unix 系 统 间 的 共享 文件 。 过 去 这 个 目录 通常 在 网 络 中 被 共享 ， 现 在 使 用 得 
越 来 越 少 ,因为 硬盘 空间 不 再 是 一 个 大 问题 ， 且 维护 /share 目 录 也 让 人 头疼 。/share 目 录 中 
经 常 包 括 /man、/info 和 其 他 子 目 录 。 


2.19.3 内核 位 置 


Linux 系 统 的 内 核 通 常 在 /vmlinuz 或 者 /boot/vmlinuz 中 。 系 统 启动 时 ， 引 导 装 载 程 序 将 这 个 文 
件 加 载 到 内 存 并 运行 ( 我们 将 在 第 5 章 详 细 介 绍 )。 

引导 装载 程序 执行 完毕 后 ,系统 就 不 再 需要 内 核 文 件 了 。 不过, 系统 在 运行 过 程 中 会 根据 需 
要 加 载 和 伸 载 许多 模块 ， 我 们 称 之 为 可 加 载 内 核 模 块 ， 它 们 在 /libimodules 目 录 下 可 以 找到 。 


2.20 ”以 超级 用 户 的 身份 运行 命令 


继续 新 内 容 之 前 , 你 需要 了 解 如 何以 超级 用 户 的 身份 运行 命令 。 你 可 能 已 经 知道 使 用 su 命令 
然后 输入 root 用 户 密码 就 可 以 启动 root 命 令 行 ， 不 过 这 个 方法 有 以 下 几 个 缺点 : 
口 对 更 改 系统 的 命令 没有 记录 信息 ; 
口 对 运行 上 述 命令 的 用 户 身份 没有 记录 信息 ; 
口 无 法 访问 普通 Shell 环 境 ; 
口 必须 输入 root 密 码 。 


2.20.1 _ sudo 命令 


大 部 分 Linux 系 统 中 , 管理 员 可 以 使 用 自己 的 用 户 账号 登录 , 然后 使 用 sudo 来 以 root 用 户 身份 
执行 命令 。 例 如 ， 在 第 7 章 中 ， 我 们 会 介绍 如 何 使 用 vipw 命 令 编 辑 /etc/passwd 文 件 。 例 如 : 


$ sudo vipw 


执行 sudo 命 令 时 , 它 会 使 用 local2 中 的 系统 日 志 服 务 将 操作 写 和 日志, 我们 将 在 第 7 章 详细 介绍 。 
2.20.2 /etc/sudoers 
系统 当然 不 会 允许 任何 用 户 都 能 够 以 超级 用 户 的 身份 运行 命令 ,你 需要 在 /etc/sudoers 文 件 中 
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加 入 指定 的 用 户 。sudo 命 令 有 很 多 选项 ， 使 用 起 来 比较 复杂 。 例 如， 下 面 的 设置 允许 用 户 userl 
和 user2 不 用 输入 密码 即 可 以 超级 用 户 身份 运行 命令 : 


User Alias ADMINS = wser1, Wser2 
ADMINS ALL = NOPASSWD: ALL 


root ALL=(ALL) ALL 


第 一 行为 user1 和 user2 指 定 一 个 ADMINS 别 名 ， 第 二 行 赋予 它们 权限 。ALL = NOPASSWD: ALL 表 
示 有 ADMINS 别 名 的 用 户 可 以 运行 sudo 命 令 。 该 行 中 第 二 个 ALL 代 表 允 许 执 行 任何 命令 ， 第 一 个 ALL 
表示 人 允许 在 任何 主机 运行 命令 ( 如果 你 有 多 个 主机 ， 你 可 以 针对 某 个 主机 或 者 某 一 组 主机 设置 ， 
这 个 我 们 在 这 里 不 详细 介绍 )。 

root ALL=(ALL) ALL 表 示 root 用 户 能 够 在 任何 主机 上 执行 任何 命令 。(ALL) 表 示 root 用 户 可 以 以 
任何 用 户 的 身份 运行 命令 。 你 可 以 通过 以 下 方式 将 (ALL) 权 限 赋予 有 ADMINS 别 名 的 用 户 ， 将 (ALL) 
加 入 到 /etc/sudoers 行 ， 如 人 @ 所 示 : 


ADMINS ALL = (ALL)@ NOPASSWD: ALL 


注解 ”可 以 使 用 visudo 命 令 编 辑 /etc/sudoers 文 件 ， 该 命令 在 保存 文件 时 会 做 语法 检查 。 


sudo 命 令 我 们 现在 就 介绍 到 这 里 ， 详 细 的 使 用 方法 请 参考 sudoers(5) 和 sudo(8) 帮 助手 册 。( 用 
户 切 换 的 详细 内 容 我 们 将 在 第 7 章 介绍 。) 


2.21 前瞻 


目前 为 止 你 对 以 下 这 些 命令 已 经 有 所 了 解 : 运行 程序 、 重 定向 输出 、 文 件 和 目录 操作 、 查 看 
进程 、 查 看 帮助 手册 以 及 用 户 空 间 。 你 应 该 也 学 会 了 以 超级 用 户 身 份 运行 命令 。 关 于 用 户 空间 组 
牛 和 内 核 的 详细 内 容 , 你 可 能 还 不 其 了 解 , 但 掌握 了 文件 和 进程 的 基础 知识 后 ， 这些 也 不 再 是 难 
和 。 在 下 面 的 章节 中 ， 我 们 就 来 介绍 如 何 使 用 这 些 命令 来 操作 内 核 和 用 户 空间 。 


一 、 


hl 
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设备 管理 


本 章 介 绍 与 Linux 系 统 内 核 提 供 的 设备 相关 的 基础 设 
施 。 纵 观 Linux 发 展 史 ， 内 核 向 用 户 呈现 设备 的 方式 发 生 了 
很 大 变化 。 我 们 将 从 传统 的 设备 文件 系统 开始 ,介绍 内 核 如 
何 通过 sysfs 来 提供 设备 配置 信息 。 我 们 的 目标 是 能 够 通过 在 
系统 上 收集 设备 信息 来 了 解 一 些 基本 操作 。 后 面 的 章节 将 进 


一 步 介 绍 一 些 具 体 设备 的 管理 。 


N| 


理解 内 核 怎样 在 用 户 空间 呈现 新 设备 很 关键 。 udev 系统 让 用 户 空间 进程 能 够 自动 配置 和 使 用 
新 设备 。 我 们 将 介绍 内 核 如 何 通 过 udev 向 用 户 空间 进程 发 送 消息 ， 以 及 进程 如 何 处 理 这 些 消 息 。 


3.1 设备 文件 


在 Unix 系 统 中 操纵 大 多 数 设备 都 很 容易 ， 因 为 很 多 LO 接口 都 是 以 文件 的 形式 由 内 核 呈 现 给 
用 户 的 。 这 些 设备 文件 有 时 又 叫 作 设 备 节点 。 开 发 人 员 可 以 像 操 作文 件 一 样 来 操作 设备 ， 一 些 
Unix 标 准 命令 ( 如 cat ) 也 可 以 访问 设备 ， 所 以 不 仅仅 开发 人 员 ， 普 通用 户 也 能 够 访问 设备 。 然 
而 对 文件 接口 所 能 执行 的 操作 是 有 限制 的 , 所 以 并 不 是 所 有 设备 或 设备 功能 都 能 够 通过 标准 文件 
LO 方式 来 访问 。 

Linux 处 理 设 备 文件 的 方式 和 Unix 一 样 。 设 备 文件 存放 在 /dev 目 录 中 ， 可 以 使 用 ls /dev 命令 
来 查看 。 

我 们 从 下 面 这 个 命令 开始 : 


$ echo blah blah > /dev/null 


这 个 命令 将 执行 结果 从 标准 输出 重 定 向 到 一 个 文件 ， 这 个 文件 是 /dev/null， 它 是 一 个 设备 ， 
内 核 决定 如 何 处 理 设备 的 数据 写 入 。 对 /dev/null 来 说 ， 内 核 直接 忽略 输入 数据 。 


图 灵 社 区 会 员 小 虎 (164142021@qq.com) 专 享 尊重 版 权 


38 第 3 章 设备 管理 


你 可 以 使 用 1s -1 来 查看 设备 及 其 权限 。 
例 3-1 设备 文件 


$ 1s -1 

brw-rw---- 1 root disk 8, 1 Sep 6 08:37 sdal 
CIW-IW-IW- 1 root root 1, 3 Sep 6 08:37 null 
prw-r--r-- 1 root root 0 Mar 3 19:17 fdata 
SIW-IW-IW- 1 root root 0 Dec 18 07:43 log 


请 注意 , 上 面 每 一 行 的 第 一 个 字符 ( 代表 文件 模式 ): 字符 b (block )、c ( character )、p ( pipe ) 
和 s (socket ) 代表 设备 文件 。 下 面 是 详细 介绍 。 

块 设备 

程序 从 块 设备 中 按 固定 的 块 大 小 读 取 数据 。 前 面 的 例子 中 ，sdal 是 一 个 磁盘 设备 ， 它 是 块 设 
备 的 一 种 。 我 们 能 够 轻松 地 将 磁盘 划分 成 数据 区 块 。 因 为 磁盘 的 容量 是 固定 的 ,索引 起 来 也 很 方 
便 ， 所 以 进程 能 够 通过 内 核 访问 磁盘 上 的 任意 区 块 。 

字符 设备 

字符 设备 处 理 流 数 据 。 你 只 能 对 字符 设备 读 取 和 写 入 字符 数据 ， 如 前 面 例子 中 的 /dev/null。 
字符 设备 没有 国定 容量 ， 当 你 对 字符 设备 进行 读 写 时 ,内 核对 相应 的 设备 进行 读 写 操作 。 字符 设 
备 的 一 个 例子 是 打印 机 ， 值 得 注意 的 是 ， 内 核 在 流 数据 送 达 设 备 和 进程 后 不 会 备份 和 再 次 验证 。 

管道 设备 

命名 管道 设备 和 字符 设备 类 似 , 不同 的 是 输入 输出 端 不 是 内 核 驱动 程序 , 而 是 另外 一 个 进程 。 

套 接 字 设备 

套 接 字 设 备 是 跨 进 程 通信 经 常用 到 的 特殊 接口 。 它 们 经 常会 存放 于 /dev 目 录 之 外 。 套 接 字 文 
件 代 表 Unix 域 套 接 字 ， 我 们 将 在 第 10 音 详细 介绍 。 

在 例 3-1 的 第 1、2 行 中 ,日 期 前 的 两 个 数字 代表 主要 和 次 要 设备 号 ， 它 们 是 内 核 用 来 识别 设 
备 的 数字 。 相 同类 型 的 设备 一 般 有 相同 的 主 设备 号 ， 比 如 sda3 和 sdbl (它们 都 是 磁盘 分 区 )。 


注解 ”并 不 是 所 有 的 设备 都 有 对 应 的 设备 文件 , 因为 块 设备 和 字符 设备 并 不 是 适合 所 有 场合 的 。 
例如 ， 网 络 接口 没有 设备 文件 ， 虽 然 其 理论 上 可 以 使 用 字符 设备 来 代表 ， 但 是 实现 起 来 
实在 很 困难 ， 所 以 内 核 采 用 了 其 他 的 IO 接口 。 


3.2 sysfs 设备 路 径 


传统 的 Unix /dev 目 录 为 用 户 进程 与 使 用 内 核 支 持 的 设备 进行 引用 与 交互 提供 了 便利 , 但 是 它 
过 于 简单 。/dev 目 录 中 的 文件 名 包含 有 关 设 备 的 一 些 信息 ， 但 不 是 很 详尽 。 另 一 个 问题 是 内 核 根 
据 其 找到 设备 的 顺序 为 设备 文件 命名 ， 所 以 系统 每 次 重新 启动 后 ， 设 备 文件 名 有 可 能 不 同 。 

Linux 内 核 通过 一 个 文件 和 目录 系统 提供 sysfs 界 面 ， 旨 在 基于 硬件 属性 统一 显示 设备 的 相关 


图 灵 社 区 会 员 小 虎 (164142021@qq.com) 专 享 尊重 版 权 


3.3 dd 命令 和 设备 39 


信息 。 设 备 以 /sys/devices 为 Toot 路 径 。 例 如 ，/devw/sda 代 表 的 SATA 硬 盘 在 sysfs 中 的 路 径 可 能 是 : 


/sys/devices/pci0000:00/0000:00:1f.2/hosto/target0:0:0/0:0:0:0/block/sda 


你 可 以 看 到 ， 这 个 路 径 比 文件 名 /devsda 长 很 多 ， 后 者 也 是 一 个 目录 。 但 你 实际 上 不 能 对 比 
这 两 个 路 径 , 因为 它们 的 作用 不 一 样 。/dev 目 录 中 的 文件 是 供用 户 进程 使 用 设备 的 , 而 /sys/devices 
中 的 文件 是 用 来 查看 设备 信息 和 管理 设备 用 的 。 如 果 你 打开 上 述 设备 路 径 ， 就 能 够 看 到 类 似 下 面 
的 内 容 : 


alignment offset discard alignment holders removable size uevent 
bdi events inflight ro slaves 

capability events async power sdal stat 

dev events poll msecs queue sda2 subsystem 

device ext_range range sda5 trace 


这 些 文件 和 子 目 录 一 般 都 是 供 程序 而 不 是 用 户 访 问 的 , 但 你 可 以 通过 诸如 /dev 文 件 这 样 的 例 
子 来 了 解 它 们 包含 和 代表 的 内 容 。 运 行 命令 cat dev 会 显示 数字 8:0， 这 刚好 是 /dev/sda 设 备 的 主要 
和 次 要 编号 。 

/sys 目 录 下 有 几 个 快捷 方式 。 例 如 ，/sys/block 目 录 中 包含 系统 中 的 所 有 块 设备 文件 ， 不 过 它 
们 都 是 符号 链接 。 运 行 命令 1s -1 /sys/block 可 以 显示 指向 sysfs 的 实际 路 径 。 

在 /dev 目 录 中 查看 设备 文件 的 sys& 路 径 不 太 方便 , 可 以 使 用 udevadm 命 令 来 查看 路 径 和 其 他 属性 : 


PT 


$ udevadm info --query=all --name=/dev/sda 


注解 udevadm 命 令 在 /sbin 目 录 下 ， 如 果 你 的 路 径 中 没有 ， 可 以 将 该 目录 加 到 你 的 路 径 中 。 
udevadm 和 udev 系 统 将 在 3.5 节 详细 介绍 。 

3.3 dd 命令 和 设备 
dd 命令 对 于 块 设备 和 字符 设备 非常 有 用 , 它 的 主要 功能 是 从 输入 文件 和 输入 流 读 取 数据 然后 


写 入 输出 文件 和 输出 流 ， 在 此 过 程 中 可 能 涉及 到 编码 转换 。 
dd 命令 复制 固定 大 小 的 数据 块 ， 例 如 下 面 的 代码 显示 如 何 借 助 字 符 设备 使 用 dd 命令 : 


$ dd if=/dev/zero of=new file bs=1024 count=1 


dd 命令 的 格式 选项 和 大 多 数 其 他 Unix 命 令 不 同 ， 它 沿袭 了 从 前 的 IBM Job Control Language 
(JCL ) 的 风格 。 它 使 用 等 号 = 而 不 是 减 号 -来 设 定 选项 和 参数 值 。 上 面 的 例子 是 从 /dewzero 复 制 一 
个 大 小 为 1024 字 节 的 数据 块 到 文件 new_file。 

以 下 是 dd 命令 的 一 些 重要 选项 。 
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口 if=file: 代表 输入 文件 ， 默 认 是 标准 输入 。 
口 of=file: 代表 输出 文件 ， 默 认 是 标准 输出 。 


口 bs=size: 代表 数据 块 大 小 。dd 命 令 一 次 读 取 或 者 写 和 人 数据 的 大 小 。 对 于 海量 数据 ， 你 可 
以 在 数字 后 设置 p 和 k 来 分 别 代表 512 字 节 和 1024 字 节 。 如 : bs=1k 和 bs=1024 一 样 。 

口 ibs=size，obs=size: 代表 输入 和 输出 块 大 小 。 如 果 输 入 输出 块 大 小 相同 ， 你 可 以 使 用 bs 
选项 ， 如 果 不 相同 的 话 ， 可 以 使 用 ibs 和 obs 分 别 指定 

口 count=num: 代表 复制 块 的 总 数 。 在 处 理 大 文件 或 者 无 限 数 据 流 ( /dev/zero ) 的 时 候 ， 你 
可 能 会 需要 在 某 个 地 方 停止 dd 复制 , 不 然 的 话 将 会 消耗 大 量 便 盘 空间 和 CPU 时 间 。 这 时 你 
可 以 使 用 count 和 skip 选 项 从 大 文件 或 设备 中 复 氏 

口 skip=num: 代表 跳 过 前 面 的 num 个 块 ， 不 将 它们 复 


M4 


则 一 小 部 分 数据 。 


央 到 输出 。 
警告 ”dd 命令 功能 非常 强大 ， 你 需要 先 对 其 充分 了 解 再 使 用 ， 否 则 稍 一 朴 忽 就 会 损坏 文件 和 设 
备 上 的 数据 。dd 命 令 通常 用 来 将 输出 数据 写 入 到 新 文件 。 
3.4 


设备 名 总 结 


有 时 候 查 找 设备 的 名 称 不 是 很 方便 〈 比如 在 为 硬盘 分 区 的 时 候 )， 下 面 我 们 介绍 一 些 简便 的 
方法 。 


口 使 用 udevadm 命 令 来 查询 udevd ( 见 3.5 节 )。 
口 在 /sys 目 录 下 查找 设备 。 


这 些 地 方 通常 会 有 系统 设备 的 描述 信 


息 。 
口 对 系统 已 经 找到 的 硬盘 设备 ， 可 以 使 用 mount 命 令 查看 结 


口 运行 cat /proc/devices 命 令 


口 从 dmesg ( 它 显示 最 新 的 内 核 消 息 , 见 7.2 节 ) 命令 的 输出 或 者 内 核 系统 日 志 


查获 设备 名 。 


以 查看 系统 为 之 配备 了 驱动 程序 的 块 设备 和 字符 设备 。 输 
出 结果 中 的 每 一 行 包含 设备 的 主要 编号 和 名 称 ( 见 3.1 节 )。 你 可 以 根据 主要 编号 到 /dev 目 
录 中 查找 对 应 的 块 设备 和 字符 设备 文件 。 

这 些 方法 中 只 有 第 一 个 方法 上 


较 可 靠 ， 但 是 它 需 要 udev。 如 果 你 的 系统 中 没有 udev 的 话 ， 你 
下 面 我 们 列 出 一 些 最 常见 的 Linux 设 备 及 其 命名 规范 。 


可 以 尝试 其 他 几 个 方法 ， 尽 管 有 时 候 内 核 并 没有 一 个 设备 文件 来 对 应 你 要 找 的 设备 。 
3.4.1 


人 硬盘 : /dev/sd* 


目前 Linux 系 统 中 的 硬盘 设备 大 部 分 都 以 sd 为 前 级 来 命名 ， 如 /dev/sda， /dev/sdb 等 。 这些 设备 
代表 整 块 硬盘 ， 内 核 使 用 单独 的 设备 文件 名 来 代表 硬盘 上 的 分 


区 ， 如 /devwsdal 、/dev/sda2。 
步 解释 一 下 命名 规范 。sd 代 表 SCSI disk。 小 型 计算 机 系统 接口 ( Small Computer 
System Inteface， 以 下 简称 SCSI ) 最 初 是 作为 设备 之 间 通 信 的 硬件 协议 标准 而 开发 的 ， 虽然 现 在 
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的 计算 机 并 没有 使 用 传统 的 SCSI 硬 件 , 但 是 SCSI 协 议 的 运用 却 非常 广泛 。 例 如 ，USB 存 储 设 备 就 
使 用 SCSI 协 议 进 行 通信 。SATA 硬 盘 的 情况 相对 复杂 一 些 ， 但 是 Linux 内 核 仍 然 在 某 些 场合 使 用 
SCSI 命 令 和 它们 通信 。 

我 们 可 以 使 用 sysfs 系 统 提供 的 命令 来 查看 系统 中 的 SCSI 设 备 。 最 常用 的 命令 之 一 是 lsscsi。 
行 结果 如 下 例 所 示 : 


出 


[0:0:0:0]@ disk@ ATA WDC WD3200AAJS-2 01.0 /dev/sda@ 
[1:0:0:0] cd/dvd Slimtype DVD A DS8A5SH XA15 /dev/sr0 
[2:0:0:0] disk FLASH Drive UT USB20 0.00 /dev/sdb 


上 例 中 , @ 字 上 段 是 指 设备 在 系统 中 的 地 址 ，@ 字 段 是 设备 的 描述 信息 ,全 字段 则 是 设备 文件 
的 路 径 。 其 余 的 是 设备 提供 商 的 相关 信息 。 

Linux 按 照 设备 驱动 程序 检测 到 设备 的 顺序 来 分 配 设备 文件 。 在 前 面 的 例子 中 ， 内 核 先 检测 
到 磁盘 ， 然 后 是 cd/dvd， 最 后 是 闪存 盘 。 

悲剧 的 是 ， 这 种 方式 在 重新 配置 硬件 时 会 导致 一 些 问题 。 比 如 说 你 的 系统 有 三 块 和 硬盘 : 
/dev/sda、/dev/sdb 和 /dev/sdc ， 如 果 /dev/sdb 损 坏 了 ， 你 必须 将 其 移 除 才 能 使 系统 正常 工作 ， 然 而 
/dev/sdc 已 经 不 存在 了 ,之 前 的 /dev/sdc 现 在 成 了 /dev/sdb。 如 果 你 在 fstab 文 件 ( 见 4.2.8 节 ) 中 引用 
了 /devsdc， 你 就 必须 更 新 此 文件 。 为 了 解决 这 个 问题 ， 大 部 分 现代 的 Linux 系 统 使 用 通用 唯一 标 
识 符 ( Universally Unique Identifier， 以 下 简称 UUID ， 见 4.2.4 节 ) 来 访问 设备 。 

这 里 提 到 的 内 容 不 涉及 硬盘 和 其 他 存储 设备 的 使 用 细节 ， 相 关内 容 我 们 将 在 第 4 章 介绍 。 在 
本 章 稍 后 我 们 会 介绍 SCSI 如 何 支 持 Linux 内 核 的 运行 。 


3.4.2 CD 和 DVD: /dev/sr* 

Linux 系 统 能 够 将 大 多 数 光 学 存储 设备 识别 为 SCSI 设 备 ， 如 /dewsr0 、/dewsrl 等 。 但 是 如 果 光 
驱使 用 的 是 老 接口 的 话 ， 可 能 会 被 识别 为 PATA 设 备 。/dewsr#* 设 备 是 只 读 的 ， 它 们 只 用 于 从 光盘 
上 读 取 数 据 。 可 读 写 光盘 驱动 用 /dev/sg0 这 样 的 设备 文件 表示 ，g 代 表 “generic”。 


3.4.3” PATA 硬盘: /dev/hd* 


老 版 本 的 Linux 内 核 常 用 设备 文件 /dewhda 、/dewhdb 、/dewhdc 和 /dewhdd 来 代表 老 的 块 设备 。 
这 是 基于 主 从 设备 接口 0 和 1 的 固定 设置 方式 。SATA 设 备 有 时 候 也 会 被 这 样 识 别 ,， 这 表示 SATA 设 
备 在 兼容 模式 中 运行 ， 会 造成 性 能 损失 。 你 可 以 检查 你 的 BIOS 设 置 ， 看 看 能 否 将 SATA 控 制 器 切 
换 到 它 原 有 的 模式 。 


3.4.4 终端 设备 /dewitty*、/dewpts/* 和 /dev/tty 


终端 设备 负责 在 用 户 进 程 和 输入 输出 设备 之 间 传 送 字符 ， 通 常 是 在 终端 显示 屏 上 显示 文字 。 
终端 设备 接口 由 来 已 入， 一 直 可 以 追溯 到 手动 打字 机 时 代 。 
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伪 终 端 设备 模拟 终端 设备 的 功能 ， 由 内 核 为 程序 提供 IO 接口 ， 而 不 是 真实 的 IO 设备 ，shell 
窗口 就 是 伪 终 端 。 

常见 的 两 个 终端 设备 是 /dewttyl (第 一 虚拟 控制 台 ) 和 /dev/pts/0( 第 一 虚拟 终端 )，/dev/pts 
目录 中 有 一 个 专门 的 文件 系统 。 

/dev/tty 代 表 当 前 进程 正在 使 用 的 终端 设备 ， 虽然 不 是 每 个 进程 都 连接 到 一 个 终端 设备 。 

显示 模式 和 虚拟 控制 台 

Linux 系 统 有 两 种 显示 模式 ; 文本 模式 和 X Windows 系 统 服务 器 ( 即 图 形 模式 , 通常 是 通过 显 
示 管 理 器 )。 通 常 系统 是 在 文本 模式 下 启动 , 但 是 很 多 Linux 发 行 版 通过 内 核 参 数 和 内 置 图 形 显 示 
机 制 ( 如 plymouth ) 将 文本 模式 完全 屏蔽 起 来 ， 这 样 系统 从 始 至 终 是 在 图 形 模式 下 启动 。 

Linux 系 统 支持 虚拟 控制 台 来 实现 多 个 终端 的 显示 ， 虚 拟 控制 台 可 以 在 文本 模式 和 图 形 模式 
下 运行 。 在 文本 模式 下 ， 你 可 以 使 用 ALT-Function 在 控制 台 之 间 进 行 切 换 ， 例 如 ALT-F1 切 换 到 
/dev/ttyl1 ，ALT-F2 切 换 到 /dev/tty2 等 等 。 这 些 控制 台 通 常会 被 getty 进 程 占用 以 显示 登录 提示 符 ， 
详 见 7.4 节 。 

X server 在 图 形 模式 下 使 用 的 虚拟 控制 台 稍微 有 些 不 同 ， 它 不 是 从 init 配 置 中 获得 虚拟 控制 
台 ， 而 是 由 X server 来 控制 一 个 空闲 的 虚拟 控制 台 ， 除 非 另 外 指定 。 例 如 ， 如 果 tty1 和 tty2 上 运行 
着 getty 进 程 ，X server 就 会 使 用 tty3。 此 外 ，X server 将 虚拟 控制 台 设 置 为 图 形 模式 后 ， 通 常 需要 
按 CTRL-ALT-Function 而 不 是 ALT-Function 来 切换 到 其 他 虚拟 控制 台 。 

如 果 你 想 在 系统 启动 后 使 用 文本 模式 ,可 以 按 CTRL-ALT-F1。 按 ALT-F2、ALT-F3 等 返回 X11 
会 话 。 

如 果 在 切换 控制 台 的 时 候 遇 到 问题 ， 你 可 以 尝试 chvt 命 令 强制 系统 切换 工作 台 。 例 如 : 使 用 
root 运行 以 下 命令 切换 到 tty1: 


# chvt 1 


3.4.5 ” 串 行 端口 : /dev/ttyS* 


老式 的 RS-232 和 串 行 端口 是 特殊 的 终端 设备 , 串 行 端口 设备 在 命令 行 上 运用 不 太 广 , 原因 是 
需要 处 理 诸如 波 特 律 和 流 控 制 等 参数 的 设置 。 

Windows 上 的 COM1 端 口 在 Linux 中 表示 为 /dewttyS0，COM2 表 示 为 /dewttyS1， 以 此 类 推 。 可 
揪 拔 USB 串 行 适 配器 在 USB 和 ACM 模 式 下 分 别 表示 为 : /dewttyUSB0 、/dewttyACM0 、/dewttyUSB1、 
/dewttyACMI1 等 。 


3.4.6 ”并 行 端口 : /dev/lp0 和 /dev/lp1 


单 向 并 行 端口 设备 ， 目 前 被 USB 广 泛 取代 的 一 种 接口 类 型 ， 表 示 为 : /dev/lp0 和 /dev/lp1， 分 
别 代表 Windows 中 的 LPT1: 和 LPT2:。 你 可 以 使 用 cat 命 令 将 整个 文件 (比如 说 要 打印 的 文件 ) 发 
送 到 并 行 端口 ， 执 行 完毕 后 你 可 能 需要 向 打印 机 发 送 男 外 的 指令 ( form feed 或 Yeset )。 像 CUPS 
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这 样 的 打印 服务 相 比 打印 机 来 说 提供 了 更 好 的 用 户 交互 体验 。 双向 并 行 端口 表示 为 : /dev/parport0 
和 /dev/parport1 。 


3.4.7 ”音频 设备 : /dev/snd/*、/dev/dsp、/dev/audio 和 其 他 


Linux 系 统 有 两 组 音频 设备 ,分别 是 高 级 Linux 声 音 架 构 ( Advanced Linux Sound Architecture， 
以 下 简称 ALSA ) 和 开放 声音 系统 (Open Sound System, 以 下 简称 OSS )。 ALSA 在 /dev/snd 目 录 下 ， 
要 直接 使 用 不 太 容 易 。 如 果 Linux 系 统 中 加 载 了 OSS 内 核 支 持 ， 则 ALSA 可 以 向 后 兼容 OSS 设 备 。 

OSS dsp 和 音频 设备 支持 一 些 基 本 的 操作 。 例 如， 可 以 将 WAV 文 件 发 送 给 /dev/dsp 来 播放 。 然 
而 如 果 频 率 不 匹配 的 话 , 硬件 有 可 能 无 法 正常 工作 。 并 且 在 大 多 数 系 统 中 ,音频 设备 在 你 登录 时 
通常 处 于 忙 状态 。 


注解 ” Linux 的 音频 处 理 非常 复杂 ， 因 为 涉及 很 多 层 细节 。 我们 刚刚 介绍 的 是 内 核 级 设备 ,通常 
在 用 户 空间 中 还 有 puls-audio 这 样 的 服务 来 负责 处 理 不 同 来 源 和 声音 设备 的 音频 处 理 。 


3.4.8 创建 设备 文件 


在 现代 Linux 系 统 中 ， 你 不 需要 创建 自己 的 设备 文件 ， 这 项 工作 是 由 devtmpfs 和 udev( 见 3.5 
节 ) 来 完成 。 不 过 了 解 一 下 这 个 过 程 总 是 有 益 的 ， 以 备 不 时 之 需 。 

mknod 命 令 用 来 创建 设备 。 你 必须 知道 设备 名 以 及 主要 和 次 要 编号 。 例 如 ， 可 以 使 用 以 下 命 
令 创 建设 备 /devwsdal : 


# mknod /dev/sdal b 8 2 


参数 p 8 2 分 别 代 表 块 设备 、 主 要 编号 8 和 次 要 编号 2。 字 符 设备 使 用 c， 命 名 管道 使 用 p ( 主 
要 和 次 要 编号 可 忽略 )。 

用 mknod 命 令 来 创建 临时 的 命名 管道 很 方便 ， 也 可 以 用 于 在 系统 恢复 的 时 候 创建 丢失 的 设备 
文件 。 

在 老 版 本 的 Unix 和 Linux 系 统 中 , 维护 /dev 目 录 不 是 一 件 容 易 的 事情 。 内核 每 次 更 新 和 增加 新 
的 驱动 程序 ， 能 支持 的 设备 就 更 多 ， 同 时 也 意味 着 一 些 新 的 主要 和 次 要 编号 被 指定 给 设备 文件 。 
为 了 方便 维护 ， 系 统 使 用 /dev 目 录 下 的 MAKEDEV 程 序 来 创建 设备 组 。 在 系统 升级 的 时 候 你 可 以 
看 看 有 没有 新 版 本 的 MAKEDEV ， 如 果 有 的 话 可 以 运行 它 来 创建 新 设备 。 

这 样 的 静态 管理 系统 非常 不 好 用 ， 所 以 出 现 了 一 些 新 的 选择 。 首 先是 devfs， 它 是 /dev 在 内 核 
空间 的 一 个 实现 版 本 ， 包 含 内 核 支持 的 所 有 设备 。 但 是 它 的 种 种 局 限 使 得 人 们 又 开发 了 udev 和 
devtmpfs 。 
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3.5 udev 


我 们 已 经 介绍 过 ,内核 中 的 一 些 豪 无 必要 的 复杂 功能 会 降低 系统 的 稳定 性 。 设备 文件 管理 就 
是 一 个 很 好 的 例子 ; 如 果 你 可 以 在 用 户 空 s 间 内 创建 设备 文件 的 话 , 就 不 需要 在 内 核 空间 做 。Linux 
系统 内 核 在 检测 到 新 设备 的 时 候 (如 发 现 一 个 USB 存 储 器 )， 会 向 用 户 空间 进程 发 送 消息 ( 称 为 
udevd )。 用 户 空间 进程 会 在 另 一 端 验证 新 设备 的 属性 ， 创 建设 备 文 件 ， 执 行 初 始 化 。 
理论 上 是 如 此 ， 但 实际 上 这 个 方法 有 一 些 问 题 : 系统 启动 前 期 即 需要 设备 文件 ， 所 以 udevd 
需要 在 其 之 前 启动 。udevd 不 能 依赖 于 任何 设备 来 创建 设备 文件 ， 它 必须 尽快 启动 以 免 拖延 整个 
系统 。 


3.5.1 devtmpfs 


devtmpfs 文 件 系 统 正 是 为 了 解决 上 述 问题 而 开发 的 ( 详 见 4.2 节 )。 它 类 似 老 的 devfs 系 统 ， 但 
是 更 简单 。 内 核 根 据 需 要 创建 设备 文件 ， ee 时 通知 udevd。udevd 在 收 到 通知 后 并 
不 创建 设备 文件 ， 而 是 进行 设备 初始 化 以 及 发 送 消 息 通 知 。 此 外 还 在 /dev 目 录 中 为 设备 创建 符号 
链接 文件 。 你 可 以 在 /dev/disk/by-id 目 录 中 找到 一 些 实例 ， 其 中 每 个 硬盘 对 应 一 个 或 者 多 个 文件 。 

例如 下 面 的 例子 : 


lrwxrwxrwx 1 root root 9 Jul 26 10:23 scsi-SATA WDC WD3200AAJS- WD- WMAV2FU80671 -> ../../sda 

lrwxrwxrwx 1 root root 10 Jul 26 10:23 scsi-SATA WDC WD3200AAJS- WD- WMAV2FU80671-part1 -> 
../../Ssdal 

lrwxrwxrwx 1 root root 10 Jul 26 10:23 scsi-SATA WDC WD3200AAJS- WD- WMAV2FU80671-part2 -> 
../../Ssda2 

lrwxrwxrwx 1 root root 10 Jul 26 10:23 scsi-SATA WDC WD3200AAJS- WD- WMAV2FU80671-part5 -> 
../../Ssda5 


udevd 使 用 接口 类 型 名 称 、 厂 商 、 型 号 、 序 列 号 以 及 分 区 ( 如 果 有 的 话 ) 的 组 合 来 命名 符号 
链接 。 

下 一 节 介 绍 udevd 是 怎样 创建 符号 链接 文件 的 ， 不 过 你 现在 并 不 需要 马上 了 解 。 实 际 上 ， 如 
果 你 是 第 一 次 接触 Linux 设 备 管理 ， 你 可 以 直接 跳 到 下 一 章 去 了 解 如 何 使 用 硬盘 。 


3.5.2 udevd 的 操作 和 配置 


udevd 守 护 进程 是 这 样 工 作 的 。 

(1) 内 核 通 过 一 个 内 部 网 络 链接 向 udevd 发 送 一 个 通知 事件 ， 称 作 uevent。 
(2) udevd 加 载 uevent 中 的 所 有 属性 信息 。 

(3) udevd 通 过 规则 解析 来 决定 执行 哪些 操作 和 增加 哪些 属性 
呼 人 uevent 是 udevd 从 内 核 接收 到 的 消息 ， 如 下 面 代码 所 示 : 


三 
lt 
b 
oO 


ACTION=change 
DEVNAME=sde 


图 灵 社 区 会 员 小 虎 (164142021@qq.com) 专 享 尊重 版 权 


3.5 udev 45 


DEVPATH=/devices/pci0000:00/0000:00:1a.0/usb1/1-1/1-1.2/1-1.2:1.0/host4/ 
target4:0:0/4:0:0:3/block/sde 

DEVTYPE=disk 

DISK MEDIA CHANGE=1 

MAJOR=8 

MINOR=64 

SEQNUM=2752 

SUBSYSTEM=block 

UDEV_LOG=3 


你 能 够 看 到 上 例 对 设备 做 了 一 处 修改 。 接收 到 uevent 以 后 , udevd 获 得 了 sysfs 的 设备 路 径 和 一 
些 属性 信息 ， 现 在 可 以 执行 规则 解析 了 。 
规则 文件 位 于 /lib/mdev/rules.d 和 /etc/udev/rules.d 目 录 中 。 默认 规 则 在 /lib 目 录 中 , 会 被 /etc 中 的 
规则 和 覆盖。 有关 规则 且 半 细 内 容 此 各 和 你 可 以 参考 udev(7) 帮 助手 册 。 现 在 让 我 们 看 一 下 3.5.1 
中 /dev/sda 一 例 中 的 符号 链接 。 这 些 链接 是 在 /lib/udev/rules.d/60-persistent-storage.rules 中 定义 
。 你 能 够 在 其 中 找到 如 下 内 容 : 


# ATA devices using the "scsi" subsystem 

KERNEL=="sd*[10-9] |sr*", ENV{ID SERIAL}!="?*", SUBSYSTEMS=="scsi",ATTRS{vendor}=="ATA", 
IMPORT{program}="ata_id --export $tempnode" 

# ATA/ATAPI devices (SPC-3 or later) using the "scsi" subsystem 

KERNEL=="sd*[10-9] |sr*", ENV{ID SERIAL}!="?*", SUBSYSTEMS=="scsi",ATTRS{type}=="5", 
ATTRS{scsi level}=="[6-9]*", IMPORT{program}="ata id --export $tempnode" 


这 些 规 则 和 内 核 SCSI 子 系统 呈现 的 ATA 硬 盘 相 匹配 ( 参见 3.6 节 ), 你 可 以 看 到 udevd 尝 试 匹 配 
以 sd 或 者 Sr 开头 ， 但 是 不 包含 数字 的 设备 名 (通过 表达 式 : KERNEL=="sd\*[10-9]|sr\*" )、 匹 配 
子 系统 ( SUBSYSTEMS=="scsi" ) 和 其 他 一 些 属性 。 如 果 上 述 所 有 条 件 都 满足 ， 则 进行 下 一 步 : 


IMPORT{program}="ata_id --export $tempnode" 


这 不 是 一 个 条 件 ， 而 是 一 个 指令 ， 它 从 /1ibyudev/ata_id 命 令 导 入 变量 。 如 果 你 有 匹配 的 设 
备 ， 可 以 试 着 执行 以 下 命令 行 


$ sudo /lib/udev/ata_id --export /dev/sda 

ID_ATA=1 

ID_TYPE=disk 

ID_BUS=ata 

ID_MODEL=WDC_WD3200AAJS-22L7A0 

ID MODEL ENC=WDC\x20WD3200AAJS22L7AO\x20\x20\x20\Xx20\x20\x20\x20\x20\x20\x20 
\X20\X20\X20\X20\X20\X20\X20\X20\X20 

ID_REVISION=01.03E10 

ID_SERIAL=WDC_WD3200AAJS-22L7AO_WD-WMAV2FU80671 

-- Snip-- 


上 面 所 有 变量 名 都 被 设置 了 相应 的 值 ，ENV{ID_TYPE} 的 值 对 后 面 的 规则 都 为 disk。 
ID_SERIAL 需 要 特别 注意 一 下 ， 在 每 一 个 规则 中 都 有 这 个 条 件 行 : 


图 灵 社 区 会 员 小 虎 (164142021@qq.com) 专 享 尊重 版 权 


46 第 3 章 设备 管理 


ENV{ID SERIAL}!="?*" 


意思 是 如 果 ID_SERIAL 变 量 没有 被 设置 ,条 件 语句 返回 true, 反 之 如 果 变 量 被 设置 , 则 为 false， 
当前 规则 返回 false，udevd 继 续 解析 下 一 规则 。 

这 是 什么 意思 呢 ? 这 两 条 规则 的 目的 是 找 出 硬盘 设备 的 序列 号 ,如 果 ENV{ID_SERIAL} 被 设置 ， 
udevd 就 能 够 解析 下 面 的 规则 : 


KERNEL=="sd*|sr*|cciss*", ENV{DEVTYPE}=="disk", ENV{ID SERIAL}=="?*", 
SYMLINK+="disk/by-id/$env{ID BUS}-$env{ID SERIAL}" 


你 可 以 看 到 这 个 规则 要 求 ENV{ID_SERIAL} 被 赋值 ， 它 有 如 下 指令 


SYMLINK+="disk/by-id/$env{ID BUS}-$env{ID SERIAL}" 


执行 这 个 指令 时 ，udevd 为 新 加 入 的 设备 创建 一 个 符号 链接 。 现 在 我 们 可 以 知道 设备 符号 链 
楼 的 来 由 了 。 
你 也 许 会 问 如 何在 指令 中 判断 条 件 表达 式 , 条 件 表达 式 使 用 == 或 !=, 而 指令 使 用 =、+= 或 者 :=。 


3.5.3 udevadm 


udevadm 程 序 是 udevd 的 管理 工具 , 你 可 以 使 用 它 来 重新 加 载 udevd 规 则 ,触发 消息 。 它 功能 强 
大 之 处 在 于 搜寻 和 浏览 系统 设备 以 及 监控 udevd 从 内 核 接收 的 消息 。 使 用 udevadm 需 要 掌握 一 些 命 
令 行 语法 。 

我 们 首先 来 看 看 如 何 检验 系统 设备 。 回 顾 一 下 3.5.2 节 中 的 例子 , 我 们 使 用 以 下 命令 来 查看 设 
备 ( 如 /dev/sda ) 的 udev 属 性 和 规则 : 


$ udevadm info --query=all --name=/dev/sda 


运行 结果 如 下 : 


P:/devices/pci0000:00/0000:00:1f.2/hosto/target0:0:0/0:0:0:0/block/sda 
N: sda 
S: disk/by-id/ata-WDC_ WD3200AAJS-22L7AO_WD-WMAV2FU80671 
S: disk/by-id/scsi-SATA WDC WD3200AAJS- WD-WMAV2FU80671 
9: disk/by-id/wwn-0x50014ee057faef84 

9: disk/by-path/pci-0000:00:1f.2- scsi-0:0:0:0 

E: DEVLINKS=/dev/disk/by-id/ata-WDC WD3200AAJS-22L7AO WD-WMAV2FU80671 /dev/disk/by-id/scsi 
-SATA WDC WD3200AAJS- WD-WMAV2FU80671 /dev/disk/by-id/wwn-Ox50014ee057faef84 /dev/disk/by 
-path/pci-0000:00:1f.2-scsi-0:0:0:0 

DEVNAME=/dev/sda 
DEVPATH=/devices/pci0000:00/0000:00:1f.2/hosto/target0:0:0/0:0:0:0/block/sda 
DEVTYPE=disk 

ID_ATA=1 

ID_ATA DOWNLOAD MICROCODE=1 

ID_ATA_FEATURE SET AAM=1 

-- Snip-- 
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其 中 每 一 行 的 前 缀 代表 设备 的 属性 值 ， 如 P: 代 表 sysfs 设 备 路 径 ，N: 代 表 设 备 节 点 ( /dev 下 的 
设备 文件 名 )，5: 代 表 指 向 设备 节点 的 符号 链接 ， 由 udevd 在 /dev 目 录 中 根据 其 规则 生成 ，E: 代 表 
从 udevd 规 则 中 获得 的 额外 信息 。( 另外 还 有 很 多 其 他 的 信息 ， 你 可 以 自己 运行 命令 看 一 看 。) 


3.5.4 设备 监控 


在 udevadm 中 监控 uevent 可 以 使 用 monitor 命 令 : 


$ udevadm monitor 


例如 ， 如 果 你 搬入 一 个 内 存盘 ， 该 命令 执行 结果 如 下 : 


KERNEL[658299.569485] add /devices/pci0000:00/0000:00:1d.0/usb2/2-1/2-1.2 (usb) 

KERNEL[658299.569667] add /devices/pci0000:00/0000:00:1d.0/usb2/2-1/2-1.2/2-1.2:1.0 (usb) 

KERNEL[658299.570614] add /devices/pci0000:00/0000:00:1d.0/usb2/2-1/2-1.2/2-1.2:1.0/host15 
(scsi) 

KERNEL[658299.570645] add /devices/pci0000:00/0000:00:1d.0/usb2/2-1/2-1.2/2-1.2:1.0/ 
host15/scsi host/host15 (scsi host) 

UDEV [658299.622579] add /devices/pci0000:00/0000:00:1d.0/usb2/2-1/2-1.2 (usb) 

UDEV [658299.623014] add /devices/pci0000:00/0000:00:1d.0/usb2/2-1/2-1.2/2-1.2:1.0 (usb) 

UDEV [658299.623673] add /devices/pci0000:00/0000:00:1d.0/usb2/2-1/2-1.2/2-1.2:1.0/host15 
(scsi) 

UDEV [658299.623690] add /devices/pci0000:00/0000:00:1d.0/usb2/2- 1/2-1.2/2-1.2:1.0/ 
host15/scsi host/host15 (scsi host) 

-- Snip-- 


上 面 结 果 中 ， 每 个 消息 对 应 有 两 行 信息 ， 因 为 命令 默认 显示 从 内 核 接 收 的 呼 入 消息 ( 用 
KERNEL 标 记 ) 和 udevd 在 处 理 该 消息 时 发 送 给 其 他 程序 的 消息 。 如 果 只 想 看 内 核发 送 的 消息 ， 
可 以 使 用 --kernel 选 项 ， 只 看 udev 发 送 的 消息 可 以 用 --udev。 查 看 呼 人 消息 的 所 有 属性 ( 见 3.5.2 
节 ) 可 以 使 用 --property 选 项 。 

你 还 可 以 使 用 子 系统 来 过 滤 消 息 。 例 如， 如 果 只 想 看 和 SCSI 有 关 的 内 核 消息 , 可 以 使 用 下 面 


的 命令 : 


$ udevadm monitor --kernel --subsystem-match=scsi 


udevadm 的 更 多 内 容 可 以 参考 udevadm(8) 使 用 手册 。 
关于 udev 还 有 很 多 内 容 , 比如 处 理 中 间 通 信 的 D-Bus 系 统 有 一 个 守护 进程 叫 作 udisks-daemon， 
已 通过 监听 udevd 的 呼出 消息 来 自动 通知 昔 面 应 用 系统 发 现 了 新 的 硬盘 。 


3.6 详解 SCSI 和 Linux 内 核 


本 节 我 们 将 介绍 Linux 内 核对 SCSI 的 支持 , 借 此 机 会 了 解 一 下 Linux 内 核 的 架构 。 本 节 的 内 容 
偏 理论 ， 如 果 你 想 先 了 解 如 何 使 用 硬盘 ， 可 以 直接 跳 到 第 4 童 。 
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首先 我 们 介绍 一 下 SCSI 的 背景 知识 ， 传 统 的 SCSI 硬 件 设置 是 通过 SCSI 总 线 链接 设备 到 主机 
适配器 ， 如 图 3-1 所 示 。 主 机 适配器 和 设备 都 有 一 个 SCSI ID ， 每 个 总 线 有 8 到 16 个 ID (不 同 版 本 
数量 不 同 )。SCSI 目 标 指 的 是 设备 及 其 SCSIID。 


主机 适配器 ID7 


SCSI 总 线 


图 3-1 有 主机 适配器 和 设备 的 SCSI 总 线 


计算 机 并 不 和 设备 链 直 接连 接 , 所 以 必须 通过 主机 适配器 和 设备 通信 。 主机 适 配 右 通过 SCSI 
命令 集 与 设备 进行 一 对 一 通信 ， 设 备 向 其 发 送 响 应 消息 。 

更 新 版 本 的 SCSI 如 Serial Attached SCSI ( SAS ) 的 性 能 更 出 色 ， 不 过 大 部 分 计算 机 中 并 没有 
真正 意义 的 SCSI 设 备 。 更 多 的 是 那些 使 用 SCSI 命 令 的 USB 存 储 设备 。 支 持 ATAPI 的 设备 ( 如 
CD/DVD-ROM ) 也 使 用 某 个 版 本 的 SCSI 命 令 集 。 

SATA 硬 盘 在 系统 中 通常 由 一 个 处 于 libata 层 ( 见 3.6.2 节 ) 的 转换 机 制 呈 现 为 SCSI 设 备 。 一 些 
SATA 控 制 器 ( 特别 是 高 性 能 RAID 控 制 器 ) 使 用 硬件 来 实现 这 个 转换 。 

让 我 们 用 下 面 这 个 例子 将 上 述 内 容 整 合 起 来 : 


$ lsscsi 

[0:0:0:0] disk ATA WDC WD3200AAJS-2 01.0 /dev/sda 
[1:0:0:0] cd/dvd Slimtype DVD A DS8AsSH XA15 /dev/sr0 
[2:0:0:0] disk USB2.0 CardReader CF 0100 /dev/sdb 
[2:0:0:1] disk USB2.0 CardReader SM XD 0100 /dev/sdc 
[2:0:0:2] disk USB2.0 CardReader MS 0100 /dev/sdd 
[2:0:0:3] disk USB2.0 CardReader SD 0100 /dev/sde 
[3:0:0:0] disk FLASH Drive UT_USB20 0.00 /dev/sdf 


方 括号 中 的 数字 是 SCSI 主 机 适配器 编号 ，SCSI 总 线 编号 ， 设 备 SCSIID ， 以 及 LUN ( 逻辑 元 
件 编号 ， 设 备 的 字 设备 )。 本 例 中 有 4 个 适配器 (scsi0 、scsil 、scsi2 和 scsi3 )， 它 们 都 有 一 个 单独 
的 总 线 ( 总线 编号 都 是 0 )， 每 个 总 线 上 有 一 个 设备 〈target 编 号 都 是 0 )。 编 号 为 2:0:0 的 USB 读 卡 
器 有 4 个 逻辑 单元 , 每 个 代表 一 个 可 插 人 内 存盘。 内 核 为 每 个 逻辑 单元 指定 一 个 不 同 的 设备 文件 。 
图 3-2 显 示 内 核 中 该 部 分 的 驱动 和 接口 程序 结构 ， 从 单个 设备 驱动 上 到 块 设备 驱动 ， 但 是 不 
包括 SCSI 通 用 驱动 。 
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块 设备 接口 (/dev/sda, /dev/sr0, etc.) 


磁盘 驱动 程序 (sd) CD/DVD 驱 动 程序 (sr) 


SCSI 协 议和 主机 管理 
USB 存 储 桥 


libata 翻 译 器 USB 存 储 驱 动 程序 
SAIA 主 机 驱动 程序 USB 核 心 
USB 主 机 驱动 程序 


Hardware 


USB 读 卡 器 
SATA 人 磁盘 CD/DVD USB 内 存 驱 动 | | (CE xD.MS. SD) 


图 3-2 ”Linux SCSI 子 系统 示意 图 


上 图 看 上 去 复杂 ,实际 上 整个 结构 是 非常 线性 的 。 我 们 先 从 SCSI 子 系统 和 它 的 三 层 驱动 开始 。 
口 最 顶层 负责 处 理 某 一 类 设备 。 例 如 ，sd ( SCSI 硬 盘 ) 驱动 就 在 这 一 层 ， 它 负责 将 来 自 内 
核 块 设备 接口 的 请 求 消息 翻译 为 SCSI 协 议 中 的 硬盘 相关 命令 ， 反 之 亦 然 。 

口 中 间 层 在 上 下 层 之 间 调 控 和 分 流 SCSI 消 息 , 并 且 负 责 管理 系统 中 的 所 有 SCSI 总 线 和 设备 。 
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第 
口 最 底层 负责 处 理 硬件 相关 操作 。 该 层 中 的 驱动 程序 向 特定 的 主机 适配器 发 送 SCSI 协 议 消 
息 ， 并 且 提 取 从 硬件 发 送 过 来 的 消息 。 该 层 和 最 顶层 分 开 的 原因 是 ， 虽然 SCSI 消 息 对 某 
类 设备 是 统一 的 ， 但 是 不 同类 型 的 主机 适配器 处 理 同 类 消息 的 方式 会 不 一 样 。 

最 顶层 和 最 底层 中 有 许多 各 式 各 样 的 驱动 程序 , 但 是 需要 注意 ,对 每 一 个 设备 文件 ， 内 核 都 
使 用 一 个 顶层 中 的 驱动 程序 和 一 个 底层 中 的 驱动 程序 。 对 我 们 例子 中 的 /dev/sda 硬 盘 来 说 ， 内 核 
使 用 顶层 的 sd 和 底层 的 ATA bridge。 

有 时 候 你 可 能 需要 使 用 一 个 以 上 的 顶层 驱动 程序 ( 见 3.6.3 节 )。 对 于 真正 的 SCSI 设 备 ， 如 连 
接 到 SCSI 主 机 适配器 或 者 硬件 RAID 的 硬盘 ， 底 层 驱动 程序 直接 和 下 方 的 硬件 通信 ， 这 与 大 部 分 
SCSI 子 系统 中 的 设备 不 同 。 


3.6.1 USB 存 储 设备 和 SCSI 


如 图 3-2 所 示 ， 内 核 需要 更 多 那样 的 底层 SCSI 驱 动 来 支持 SCSI 子 系统 和 USB 存 储 设备 硬件 的 
通信 。/dev/sdf 代 表 的 USB 闪 存 驱 动 支持 SCSI 命 令 , 但 是 不 和 驱动 通信 , 所 以 由 内 核 来 负责 和 USB 
系统 的 通信 。 

理论 上 ，USB 和 SCSI 很 类 似 ， 包 括 设备 类 别 、 总 线 、 主 机 控制 器 。 所 以 和 SCSI 类 似 ，Linux 
内 核 也 有 一 个 三 层 USB 子 系统 。 最 顶层 是 同类 设备 驱动 ,中 间 层 是 总 线 管 理 ， 最 底层 是 主机 控制 
驱动 。 和 SCSI 类 似 ，USB 子 系统 通过 USB 消 息 在 其 组 件 之 间 通 信 ， 它 还 有 一 个 和 1sscsi 类 似 的 命 
名 叫 lsusb。 

最 顶层 是 我 们 介绍 的 重点 , 在 这 里 驱动 程序 如 同一 个 翻译 , 它 对 一 方 使 用 SCSI 协 议 通信 , 对 
男 一 方 使 用 USB 协 议 , 并 且 存 储 硬件 在 USB 消 息 中 包含 了 SCSI 命 令 , 所 以 启动 程序 要 做 的 翻译 工 
作 仅 仅 是 重新 打包 消息 数据 。 

有 了 SCSI 和 USB 子 系统 , 你 就 能 够 和 闪存 驱动 通信 了 。 还 有 不 要 忘 了 SCSI 子 系统 更 底层 的 驱 
动 程序 ， 因 为 USB 存 储 驱 动 是 USB 子 系统 的 一 部 分 ， 而 非 SCSI 子 系统 。( 出 于 某 些 原因 ， 两 个 子 
系统 不 能 共享 驱动 程序 )。 如 果 一 个 子 系统 要 和 其 他 子 系统 通信 ， 需 要 使 用 一 个 简单 的 底层 SCSI 
桥接 驱动 来 连接 USB 子 系统 的 存储 驱动 程序 。 


3.6.2 SCSI 和 ATA 


图 3-2 中 的 SATA 人 硬盘 和 光驱 使 用 的 都 是 SATA 接 口 。 和 USB 了 驱动 一 样 ,内核 需 要 一 个 桥接 驱动 
来 将 SATA 驱 动 连接 到 SCSI 子 系统 ， 不 过 使 用 的 是 男 外 的 更 复杂 的 方式 。 光 驱使 用 ATAPI 协 议 通 
信 ， 它 是 使 用 了 ATA 协 议 编码 的 一 种 SCSI 命 令 。 然 而 硬盘 不 使 用 ATAPI 和 编码 的 SCSI 命 令 。 

Linux 内 核 使 用 libata 库 来 协调 SATA ( 以 及 ATA ) 驱动 和 SCSI 子 系统 。 对 于 支持 ATAPI 的 光驱 ， 
问题 变 得 很 简单 ， 只 需要 提取 和 打包 往来 于 ATA 协 议 上 的 SCSI 命 令 即 可 。 对 于 硬盘 就 复杂 得 多 ， 
libata 库 需要 一 整套 命令 翻译 机 制 。 

光驱 的 作用 类 似 于 把 一 本 英文 书 敲 入 计算 机 。 你 不 需要 了 人 解 书 的 内 容 , 甚至 不 懂 英 文 也 没 关 
系 。 人 硬盘 的 工作 则 类 似 把 一 本 德 文书 翻译 成 英文 并 敲 入 计算 机 。 所 以 你 必须 懂 两 种 语言 ， 以 及 了 


ll 
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解 书 的 内 容 。 
libata 能 够 将 SCSI 子 系统 连接 到 ATA/SATA 接 口 和 设备 。( 为 了 简单 起 见 ， 图 3-2 只 包含 了 一 个 
SATA 主 机 驱动 ， 实 际 上 不 止 一 个 驱动 。) 


3.6.3 通用 SCSI 设 备 


用 户 空间 进程 和 SCSI 子 系统 的 通信 通常 是 通过 块 设 备 层 和 ( 或 者 ) 在 SCSI 设 备 类 驱动 之 上 
的 另 一 个 内 核 服务 〈 如 sd 或 者 sr ) 来 进行 。 换 句 话说， 大 多 数 用 户 进 程 不 需要 了 解 SCSI 设 备 和 
命令 。 

然而 ， 用 户 进 程 也 可 以 绕 过 设备 类 驱动 通过 通用 设备 和 SCSI 设 备 直接 通信 。 例 如 我 们 在 3.6 
节 介 绍 过 的 ， 我 们 使 用 lsscsi 的 -8 选项 来 显示 通用 设备 ， 结 果 如 下 : 


] disk ATA WDC WD3200AAJS-2 01.0 /dev/sda @/dev/sgo0 
] cd/dvd Slimtype DVD A DS8A5SH XA15 /dev/sr0 /dev/sg1 
] disk USB2.0 CardReader CF 0100 /dev/sdb /dev/sg2 
2:0:0:1] disk USB2.0 CardReader SM XD 0100 /dev/sdc /dev/sg3 
] disk USB2.0 CardReader MS 0100 /dev/sdd /dev/sg4 
] disk USB2.0 CardReader SD 0100 /dev/sde /dev/sg5 
] disk FLASH Drive UT USB20 0.00 /dev/sdf /dev/sg6 


除了 常见 的 块 设备 文件 ， 上 面 的 每 一 行 还 在 @@ 字 段位 置 显 示 SCSI 通 用 设备 文件 。 例 如 光驱 
/dev/sr0 的 通用 设备 是 /dev/sg1。 

那么 我 们 为 什么 需要 SCSI 通 用 设备 呢 ?” 原 因 来 自 内 核 代 码 的 复杂 度 。 当 任务 变 得 越 来 越 复 杂 
的 时 候 , 最 好 是 将 其 从 内 核 移出 来 。 我们 可 以 考虑 下 CD/DVD 的 读 写 操作 ， 写 数据 操作 比 读 复 杂 
得 多 ,并且 没有 任何 关键 的 系统 服务 需要 依赖 于 CD/DVD 的 写 数据 操作 。 使 用 用 户 空间 进程 来 写 
数据 也 许 比 使 用 内 核 服务 要 慢 ， 但 是 却 更 容易 开发 和 维护 ， 并 且 如 果 有 bug 也 不 会 影响 到 内 核 空 
间 。 所 以 在 向 CD/DVD 写 数据 时 ， 进 程 就 使 用 像 /dev/sg1 这 样 的 通用 SCSI 设 备 。 至 于 读 取 数据 ， 
虽然 很 简单 ， 但 我 们 仍然 使 用 内 核 中 一 个 特制 的 sr 光驱 驱动 来 完成 。 


3.6.4 访问 设备 的 多 种 方法 


图 3-3 展 示 了 从 用 户 空间 访问 光驱 的 两 种 方法 : sr 和 sg ( 图 中 忽略 了 在 SCSI 更 下 层 的 驱动 )。 
进程 A 使 用 st 驱动 来 读数 据 ， 进 程 B 使 用 sg 驱动 。 然 而 ， 它 们 之 间 并 不 是 并 行 访问 的 。 
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用 户 进程 A 
(从 驱动 读 取 数据 ) 


= 


SCSI 子 系统 


用 户 进程 B 
(向 磁盘 写 数据 ) 


CD/DVD 驱动 程序 (sr) 通用 驱动 程序 (sg) 


SCSI 协 议和 主机 管理 
底层 驱动 程序 


光驱 硬件 


图 3-3 ”光学 设备 图 解 


图 中 进程 A 从 块 设备 读 取 数 据 ,， 但 是 通常 用 户 进程 不 使 用 这 样 的 方式 读 取 数据 ， 至 少 不 是 直 
接 读 取 。 在 块 设备 之 上 还 有 很 多 的 层 和 访问 人 口 ， 我 们 将 在 下 一 章 介 绍 。 
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第 4 章 


硬盘 和 文件 系统 


在 第 3 章 中 我 们 讨论 了 内 核 提 供 的 顶层 磁盘 设备 。 本 章 
我 们 将 详细 介绍 如 何在 Linux 系 统 中 使 用 磁盘 设备 。 你 将 了 
解 如 何 为 磁盘 分 区 ,在 分 区 中 创建 和 维护 文件 系统 ， 以 及 交 


磁盘 设备 对 应 /dev/sda 这 样 的 设备 文件 ， 它 代表 SCSI 子 系统 中 的 第 一 个 磁盘 。 诸 如 此 类 的 块 
设备 代表 整 块 磁盘 ， 磁 盘 中 又 包含 很 多 不 同 的 组 件 和 层 。 
图 4-1 显 示 了 典型 的 Linux 磁 盘 的 大 致 结构 ， 本 章 将 逐一 介绍 其 中 的 各 个 部 分 。 


文件 系统 数据 结构 


文件 数据 


图 4-1 Linux 人 磁盘 图 解 
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分 区 是 对 整 块 磁盘 的 进一步 划分 ， 在 Linux 系 统 中 由 磁盘 名 称 加 数字 来 表示 ， 比 如 /dev/sdal 
和 /dev/sdb3。 内 核 将 分 区 用 块 设备 呈现 ， 如 同 每 个 分 区 是 一 整 块 的 磁盘 。 分 区 数据 存放 在 磁盘 上 
的 分 区 表 中 。 


注解 ”通常 我 们 会 在 一 块 大 磁盘 上 划分 多 个 分 区 ， 因 为 老 的 计算 机 系统 只 能 使 用 磁盘 上 的 特定 
部 分 来 启动 。 系 统管 理 员 也 通过 分 区 来 为 操作 系统 预 留 一 定 的 空间 。 例如， 管理 员 不 希 
望 用 户 用 满 整 个 磁盘 从 而 导致 系统 无 法 工作 。 这 些 做 法 不 只 见于 Unix，Windows 也 是 这 
样 。 此 外 ， 大 部 分 的 系统 还 有 一 个 单独 的 交换 分 区 。 


虽然 内 核 允许 你 同时 访问 整 块 磁盘 和 某 个 分 区 , 但 是 一 般 不 需要 这 样 做 , 除非 你 在 复制 整个 磁盘 。 

分 区 之 下 的 一 层 是 文件 系统 , 文件 系统 是 用 户 空间 中 与 你 日 常 交 互 的 文件 和 目录 数据 库 。 我 
们 将 在 4.2 节 中 详细 介绍 。 

如 图 4-1 所 示 ， 如 果 你 想 要 访问 文件 中 的 数据 ， 你 需要 从 分 区 表 中 获得 分 区 所 在 位 置 ， 然 后 
在 该 分 区 的 文件 系统 数据 库 中 查找 指定 文件 的 数据 。 

Linux 内 核 使 用 图 4-2 中 的 各 个 层 来 访问 磁盘 上 的 数据 。 SCSI 子 系统 和 我 们 在 3.6 节 中 介绍 的 内 
容 由 一 个 框 代表 。( 请 注意 , 你 可 以 通过 文件 系统 或 者 磁盘 设备 来 访问 磁盘 ,我 们 本 章 都 将 介绍 。) 

让 我 们 从 最 底部 的 分 区 开始 。 


用 户 进程 


Linux 内 核 


图 4-2 ”内 核磁 盘 访问 图 解 
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4.1 为 磁盘 设备 分 区 


分 区 表 有 很 多 种 ， 比 较 典 型 的 一 种 叫 主 引导 记录 (Master Boot Record， 以 下 简称 MBR )。 另 
一 种 逐渐 普及 的 是 全 局 唯一 标识 符 分 区 表 (Globally Unique Identifier Partition Table， 以 下 简称 
GPT )。 
下 面 是 Linux 系 统 中 的 各 种 分 区 工具 。 
口 parted: 一 个 文本 命令 工具 ， 支 持 MBR 和 GPT。 
口 gparted: parted 的 图 形 版 本 。 es 
口 fdisk: Linux 传 统 的 文本 命令 分 区 工具 ， 不 支持 GPT。 
口 gdisk: fdisk 的 另 一 个 版 本 ， 支 持 GPT， 但 不 支持 MBR。 
虽然 很 多 人 喜欢 使 用 fdisk， 但 本 书 将 着 重 介绍 支持 MBR 和 GPT 的 parted。 


注解 ”parted 虽 然 也 能 够 创建 和 操作 文件 系统 ， 但 是 你 最 好 不 要 使 用 它 来 操作 文件 系统 ， 因 为 
这 样 会 引发 一 些 混淆 。 分 区 操作 和 文件 系统 操作 还 是 有 本 质 的 不 同 。 分 区 表 划 分 磁盘 的 
区 域 ， 而 文件 系统 侧重 数据 管理 ， 因 此 我 们 使 用 parted 分 区 ， 使 用 另外 的 工具 来 创建 文 
件 系 统 ( 见 4.2.2 节 )，parted 的 文档 中 也 是 这 样 建议 的 。 


4.1.1 查看 分 区 表 
你 可 以 使 用 命令 parted -1 查看 系统 分 区 表 。 如 下 例 所 示 。 


# parted -1 

Model: ATA WDC WD3200AAJS-2 (scsi) 

Disk /dev/sda: 320GB 

Sector size (logical/physical): 512B/512B 
Partition Table: msdos 


Number Start End Size Type File system Flags 
1 1049kB 316GB 316CGB primary ext4 boot 
2 316GB 320GB 4235MB extended 
5 316GB 320GB 4235MB logical linux-swap(v1) 


Model: FLASH Drive UT_USB20 (scsi) 

Disk /dev/sdf: 4041MB 

Sector size (logical/physical): 512B/512B 
Partition Table: gpt 


Number Start End Size File system Name Flags 
1 17.4kB 1000MB 1000MB myfirst 
2 1000MB 4040MB 3040MB mysecond 


第 一 个 设备 /dev/sda 使 用 传统 的 MBR 分 区 表 ( parted 中 称 为 msdos ), 第 二 个 设备 使 用 GPT 表 。 
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请 注意 ,由 于 分 区 表 类 型 不 同 , 所 以 它们 的 参数 也 不 同 。MBR 表 中 没有 名 称 这 一 列 ， 而 GPT 表 中 
则 有 名 称 列 (这 里 我 们 随意 取 了 两 个 名 称 myfirst 和 mysecond )。 

上 例 中 的 MBR 表 包含 主 分 区 、 扩 展 分 区 和 逮 辑 分 区 。 主 分 区 是 磁盘 的 常规 分 区 (如 上 例 中 
的 1 )。MBR 最 多 只 能 有 4 个 主 分 区 ， 如 果 需 要 更 多 分 区 ， 你 要 将 一 个 分 区 设置 为 扩展 分 区 ， 然 后 
将 该 扩展 分 区 划分 为 数 个 逻辑 分 区 。 上 例 中 的 2 是 扩展 分 区 ， 在 其 上 有 逻辑 分 区 5。 


注解 ”parted 命 令 显 示 的 文件 系统 不 一 定 是 MBR 中 的 系统 ID。MBR 系 统 ID 只 是 一 个 数字 ， 例 如 
83 是 Linux 分 区 ，82 是 Linux 交 换 分 区 。 因 而 parted 自 己 来 决定 文件 系统 。 如 果 你 想 知 道 
MBR 中 的 系统 ID， 可 以 使 用 命令 fdisk -1。 


内 核 初 始 化 读 取 
Linux 内 核 在 初始 化 读 取 MBR 表 时 ， 会 显示 以 下 的 调试 信息 〈 使 用 dmesg 命 令 来 查看 ): 


sda: sda1 sda2 < sda5 > 


sda2 < sda5 > 表示 /dev/sda2 是 一 个 扩展 分 区 ， 它 包含 一 个 逻辑 分 区 /dewsda5。 通 常 你 只 需要 
访问 逻辑 分 区 ， 所 以 扩展 分 区 可 以 忽略 。 


4.1.2 更改 分 区 表 


查看 分 区 表 相 对 更 改 分 区 表 来 说 比较 简单 和 安全 , 虽然 更 改 分 区 表 也 不 是 很 复杂 , 但 还 是 有 
一 定 的 风险 ， 所 以 需要 特别 注意 以 下 两 点 。 
口 删除 分 区 以 后 ， 分 区 上 的 数据 很 难 被 恢复 ， 因 为 你 删除 的 是 该 文件 系统 最 基本 的 信息 。 
所 以 最 好 事先 对 数据 做 备份 。 
口 确保 你 操作 的 磁盘 上 没有 分 区 正在 被 系统 使 用 。 因 为 大 多 数 Linux 系 统 会 自动 挂 载 被 删除 

的 文件 系统 (参见 4.2.3 节 )。 

一 切 准 备 就 绕 后 ,你 可 以 开始 选择 使 用 哪个 分 区 程序 了 。 你 可 以 使 用 命令 行 工具 parted 或 者 
图 形 界面 工具 gparted。 如 果 你 在 使 用 GPT 分 区 的 话 ， 可 以 使 用 gdisk。 这 些 工具 都 有 在 线 帮助 ， 
很 容易 掌握 。( 如 果 你 的 磁盘 空间 不 够 ， 你 可 以 使 用 闪存 盘 等 设备 来 尝试 使 用 它们 。) 

fidsk 和 parted 有 很 大 区 别 。fdisk 让 你 首先 设计 好 分 区 表 ， 然 后 在 退出 fdisk 之 前 才 做 实际 的 
更 改 。parted 则 是 在 你 运行 命令 的 同时 直接 执行 创建 、 更 改 和 删除 操作 ， 你 没有 机 会 在 做 更 改 之 
前 确认 检查 。 

这 样 的 区 别 也 能 够 帮助 我 们 了 解 它们 和 内 核 是 如 何 交 互 的 。fdisk 和 parted 都 是 在 用 户 空间 
中 对 分 区 做 更 改 ， 所 以 没有 必要 为 它们 提供 内 核 支持 。 

但 是 ， 内 核 还 是 必须 负责 读 取 分 区 表 并 将 分 区 呈现 为 块 设备 。fdisk 使 用 了 一 种 相对 简单 的 
方式 来 处 理 : 更 改 分 区 表 之 后 ，fdisk 向 内 核发 送 一 个 磁盘 系统 调用 ， 告 诉 内 核 需要 重新 读 取 分 
区 表 ， 内核 会 显示 一 些 调试 信息 供 你 使 用 dmesg 查 看 。 例 如， 如 果 你 在 /dev/sdf 上 创建 了 两 个 分 区 ， 


图 灵 社 区 会 员 小 虎 (164142021@qq.com) 专 享 尊重 版 权 


4.1 为 磁盘 设备 分 区 57 


你 会 看 到 如 下 信息 : 


sdf: sdf1 sdf2 


相 比 之 下 ，parted 没 有 使 用 磁盘 系统 调用 ， 而 是 在 分 区 表 被 更 改 的 时 候 向 内 核发 送信 号 ， 内 
核 也 不 显示 调试 信息 。 
你 可 以 用 以 下 方式 来 查看 对 分 区 的 更 改 。 
口 使 用 udevadm 查 看 内 核 消息 更 改 。 例 如 : udevadm monitor --kernel 会 显示 被 删除 的 分 区 和 
新 创建 的 分 区 。 
口 在 /proc/partitions 中 查看 完整 的 分 区 信息 。 
口 在 /sys/block/device 中 查看 更 改 后 的 分 区 系统 接口 信息 ， 在 /dev 中 查看 更 改 后 的 分 区 设备 。 
如 果 你 想 100% 确 定 你 是 否 更 改 了 分 区 表 , 你 可 以 使 用 blockdev 命 令 。 例如 , 要 让 内 核 重 新 加 
载 /dev/sdf 上 的 分 区 表 ， 可 以 运行 下 面 的 命令 : 


# blockdev --rereadpt /dev/sdf 


到 目前 为 止 ,你 应 该 了 解 了 磁盘 分 区 的 相关 内 容 ,如果 你 想 了 解 更 多 有 关 磁 盘 的 内 容 ,可 以 
继续 。 你 也 可 以 直接 跳 到 4.2 节 去 了 解 文件 系统 的 内 容 。 


4.1.3 ”磁盘 和 分 区 的 构造 


包含 可 移动 部 件 的 设备 会 为 操作 系统 带 来 一 定 的 复杂 度 , 因为 抽象 起 来 比较 复杂 。 磁盘 就 是 
这 样 的 设备 ， 虽 然 你 可 以 把 它 看 成 是 一 个 块 设 备 ， 可 以 随机 访问 其 中 的 任何 地 方 , 但 是 如 果 你 对 
磁盘 数据 规划 得 不 好 ， 就 会 导致 很 严重 的 性 能 问题 。 参 见 图 4-3。 

磁盘 中 有 一 个 转轴 ， 上 面 有 一 个 转盘 ,还 有 一 个 覆盖 磁盘 半径 的 可 以 移动 的 杆 ， 上 面 有 一 个 
读 写 头 ， 磁 盘 在 读 写 头 下 旋转 ， 读 写 头 负责 读 取 数据 。 读 写 头 只 能 读 取 移 动 杆 当 前 所 在 位 置 圆 周 
范围 内 的 数据 。 这 个 圆周 我 们 称 作 柱 面 。 大 容量 的 磁盘 通常 在 一 个 转轴 上 有 多 个 转盘 又 加 在 一 起 
旋转 。 每 个 转盘 有 一 到 两 个 读 写 头 ， 负 责 转盘 正面 和 背面 的 读 写 。 所 有 读 写 头 都 由 一 个 移动 杆 控 
制 ， 协同 工作 。 磁 盘 的 柱 面 从 圆心 到 边缘 由 小 变 大 。 你 可 以 将 柱 面 划 分 为 扇 区 。 磁 盘 这 样 的 构造 
我 们 称 为 CHS ， 意 指 柱 面 (cylinder ) - 读 写 头 (head ) - 扇 区 (sector )。 


注解 ”磁盘 轨道 是 读 写 头 访问 柱 面 的 那 一 部 分 ， 在 图 4-3 中 ， 柱 面 也 是 一 个 轨道 。 对 磁盘 轨道 你 
可 以 不 用 深究 。 


通过 内 核 和 各 种 分 区 程序 你 能 够 知道 磁盘 的 柱 面 ( 和 扇 区 ) 数 。 然 而 在 现在 的 硬盘 中 这 些 数 
字 并 不 准确 。 传 统 使 用 CHS 的 寻 址 方式 无 法 适应 现在 的 大 容量 硬盘 ,也 无 法 处 理 外 道 柱 面 比 内 道 
柱 面 存储 更 多 数据 这 样 的 情况 。 磁 盘 硬 件 支 持 逻 辑 块 寻 址 (Logical Block Addressing， 以 下 简称 
LBA )， 通 过 块 编号 来 寻 址 ， 其 余部 分 还 是 使 用 CHS。 例 如 ，MBR 分 区 表 包 含 CHS 信 息 和 对 应 的 
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LBA 信 息 ， 虽 然 一 些 引 导 装 载 程 序 仍然 使 用 CHS， 但 大 部 分 都 是 用 LBA。 


柱 面 
CN 读 写 头 
主轴 
硬盘 驱动 辟 
碟 片 


图 4-3 ”硬盘 俯视 图 


柱 面 是 一 个 很 重要 的 概念 , 用 来 设置 分 区 边界 。 从 柱 面 读 取 数据 速度 是 很 快 的 ， 因 为 磁盘 的 
旋转 可 以 让 读 写 头 持续 地 读 取 数据 。 将 分 区 放 到 相 邻 柱 面 也 能 够 加 快 数据 存 取 , 因为 这 样 可 以 缩 
小 读 写 头 移动 的 距离 。 

如 果 你 没有 将 分 区 精确 地 置 于 柱 面 边界 ,一 些 分 区 程序 会 提出 警告 , 你 可 以 忽略 之 , 因为 现 
在 的 硬盘 提供 的 CHS 信 息 不 准确 。LBA 则 能 够 确保 你 的 分 区 位 置 正确 。 


4.1.4 固态 硬盘 


固态 硬盘 (Solid State Disk， 以 下 简称 SSD ) 这 样 的 存储 设备 和 旋转 式 硬 盘 区 别 很 大 ， 因 为 
它们 没有 可 移动 的 部 件 。 由 于 不 需要 读 写 头 在 柱 面 上 移动 , 所 以 随机 存 取 不 成 问题 , 但 是 也 有 一 
些 因 素 影 响 到 其 性 能 。 

分 区 布局 是 影响 SSD 性 能 的 一 个 方面 。SSD 通 党 每 次 读 取 4096 字 节 的 数据 ， 所 以 如 果 要 读 取 
的 数据 没有 在 同一 区 块 内 ， 就 需要 两 次 读 取 操 作 。 这 对 于 那些 经 常 性 的 操作 ( 如 读 取 目录 内 容 ) 
来 说 性 能 会 降低 。 

许多 分 区 工具 ( 如 parted 和 gparted ) 能 够 为 新 分 区 设置 合理 的 位 置 ， 所 以 你 不 需要 担心 这 
个 问题 。 不 过 如 果 你 想 知 道 你 的 分 区 所 在 位 置 和 边界 ， 例 如 分 区 /devsdfP2 ， 你 可 以 使 用 以 下 命令 
查看 : 


$ cat /sys/block/sdf/sdf2/start 
1953126 


该 分 区 从 距离 磁盘 起 始 位 置 1 953 126 字 节 的 地 方 开 始 ， 由 于 不 是 4096 的 整数 倍 ， 所 以 该 分 区 
在 SSD 上 无 法 获得 最 佳 性 能 。 
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4.2 文件 系统 


文件 系统 通常 是 内 核 和 用 户 空 间 之 间 联 系 的 最 后 一 环 , 也 就 是 通过 1s 和 cd 等 命令 进行 交互 的 
对 象 。 之 前 介绍 过 , 文件 系统 是 一 个 数据 库 ， 它 将 简单 的 块 设备 映射 为 用 户 易于 理解 的 树 状 文件 
目录 结构 。 

以 往 的 文件 系统 位 于 磁盘 和 其 他 类 似 的 存储 设备 上 ，, 只 单纯 地 负责 数据 存储 。 然而 文件 系统 
的 树 状 文件 目录 结构 和 1/O 接 口 还 有 很 多 功能 。 现 在 的 文件 系统 能 够 处 理 各 式 各 样 的 任务 ， 比 如 
目录 /sys 和 /proc 中 的 那些 系统 接口 。 以 往 都 是 由 内 核 负责 实现 文件 系统 ，Plan 9 的 9P 
( http://plan9.bell-labs.com/sys/doc/9.html ) 的 出 现 促进 了 文件 系统 在 用 户 空间 中 的 实现 。 用 户 空间 
文件 系统 (File System in User Space， 简 称 FUSE ) 这 一 特性 使 得 在 Linux 上 实现 用 户 空间 文件 系 
统 成 为 可 能 。 

抽象 层 虚 拟 文件 系统 (Virtual File System, 以 下 简称 VFS ) 负责 文件 系统 的 具体 实现 。 像 SCSI 
子 系统 将 设备 之 间 和 设备 与 内 核 之 间 的 通信 标准 化 一 样 ，VFS 为 用 户 空间 进程 访问 不 同文 件 系 统 
提供 了 标准 的 接口 。VFS 使 得 Linux 能 够 支持 很 多 不 同 的 文件 系统 。 


4.2.1 文件 系统 类 型 


Linux 文 持原 生 设 计 的 并 且 针对 Linux 进 行 过 优化 的 文件 系统 ， 支 持 Windows FAT 这 样 的 外 来 
文件 系统 ,支持 ISO 9660 这 样 的 通用 文件 系统 ， 以 及 很 多 其 他 文件 系统 。 下 面 我 们 列 出 了 常见 的 
文件 系统 ，Linux 能 够 识别 的 那些 我 们 在 名 称 后 加 上 了 类 型 名 称 和 括号 。 

口 第 四 扩展 文件 系统 (以 下 简称 ext4 ): 是 Linux 原 生 文 件 系 统 的 当前 版 本 。 第 二 扩展 文件 系 

统 (以 下 简称 ext2 ) 作为 Linux 的 默认 系统 已 经 存在 了 很 长 时 间 ， 它 源 于 传统 的 Unix 文 件 
系统 ( 如 Unix File System - UFS 和 Fast File System - FFS )。 第 三 扩展 文件 系统 (以 下 简称 
ext3 ) 增加 了 日 志 特 性 ( 在 文件 系统 数据 结构 之 外 的 一 个 小 的 缓存 机 制 )， 提 高 了 数据 的 
完整 性 和 启动 速度 。ext4 文 件 系 统 在 ext2 和 ext3 的 基础 上 不 断 完善 ， 支 持 更 大 的 文件 和 更 
多 的 子 目 录 个 数 。 扩 展 文件 系统 的 各 个 版 本 都 向 后 兼容 。 例 如 ， 你 可 以 将 ext2 和 ext3 挂 载 
为 ext3 和 ext2 ， 你 也 可 以 将 ext2 和 ext3 挂 载 为 ext4 ， 但 是 你 不 能 将 ext4 挂 载 为 ext2 和 ext3。 

口 ISO 9660 (iso9660 ): 是 一 个 CD-ROM 标 准 。 大 多 数 CD-ROM 都 是 使 用 该 标准 的 某 个 版 本 。 

口 FAT 文 件 系统 (msdos 、vfat 、umsdos ): 是 微软 的 文件 系统 。msdos 很 简单 ， 支 持 最 基本 
的 单字 符 MS-DOS 系 统 。 在 新 版 本 的 Windows 中 如 果 要 支持 Linux， 你 应 该 使 用 vfat 文 件 系 
统 。umsdos 这 个 系统 很 少 用 到 ， 它 在 MS-DOS 的 基础 上 支持 Linux 和 一 些 Unix 特 性 ， 如 符 
号 链接 。 

口 HFS+ ( hfsplus ): 是 苹果 Macintosh 计 算 机 的 文件 系统 标准 。 

虽然 扩展 文件 系统 的 各 个 版 本 已 经 应 用 得 很 好 ， 然 而 其 中 也 加 入 了 很 多 高 级 的 功能 ，ext4 由 
于 向 后 兼容 的 考虑 都 无 法 使 用 。 高 级 功能 主要 涉及 对 大 数量 文件 、 大 尺寸 文件 以 及 其 他 类 似 情形 
的 支持 。 正 在 开发 中 的 Btrfs 这 样 的 文件 系统 将 来 有 可 能 取代 扩展 文件 系统 。 
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4.2.2 创建 文件 系统 


当 完成 了 4.1 节 中 介绍 的 分 区 操作 后 ， 你 就 可 以 创建 文件 系统 了 。 和 分 区 一 样 ， 用 户 空间 进 
程 能 够 访问 和 操作 块 设备 ， 所 以 你 可 以 在 用 户 空 间 中 创建 文件 系统 。mkfs 工 具 可 以 创建 很 多 种 文 


EE 


件 系统 ， 例 如， 你 可 以 使 用 以 下 命令 在 /dev/sd 人 2 上 创建 ext4 分 区 : 


# mkfs -t ext4 /dev/sdf2 


mkfs 能 够 自己 决定 设备 上 的 块 数量 并 且 设 置 适当 的 默认 值 , 除非 你 确定 该 怎么 做 并 且 阅 读 了 
详细 的 文档 ， 否 则 你 不 需要 更 改 默 认 参 数 。 

mkfs 在 创建 文件 系统 的 过 程 中 会 显示 诊断 信息 ， 其 中 包括 起 级 块 的 输出 信息 。 超 级 块 是 文件 
系统 数据 库 上 层 的 一 个 重要 组 件 ， 以 至 于 mkfs 对 其 有 多 个 备份 以 防 其 损坏 。 你 可 以 记录 下 超级 块 
备份 编号 以 防 万 一 磁盘 出 现 故 障 (参见 4.2.11 节 )。 


警告 你 只 需要 在 增加 新 磁盘 和 修复 现 有 磁盘 的 时 候 创建 文件 系统 。 一 般 是 对 没有 数据 的 新 分 
区 进行 此 操作 ， 或 者 分 区 已 有 的 数据 你 不 再 需要 了 。 如 果 在 已 有 文件 系统 上 创建 新 的 文 
件 系统 ， 所 有 已 有 的 数据 将 会 丢失 。 


mkfs 是 一 系列 文件 系统 创建 程序 的 前 端 界面 , 如 mkfs.fs。 各 是 一 种 文件 系统 类 型 。 当 运行 mkfs 
-t ext4 时 ， 实 际 上 运行 的 是 mkfs .ext4。 

你 可 以 通过 查看 mkfs.* 文 件 看 到 更 多 的 相关 程序 : 
$ 1s -1 /sbin/mkfs.* 


-ITWXT-XT-X 1 root root 17896 Mar 29 21:49 /sbin/mkfs.bfs 
-ITWXT-XT-X 1 root root 30280 Mar 29 21:49 /sbin/mkfs.cramfs 


J]rwxrwxrwx 1 root root 6 Mar 30 13:25 /sbin/mkfs.ext2 -> mke2fs 
J]rwxrwxrwx 1 root root 6 Mar 30 13:25 /sbin/mkfs.ext3 -> mke2fs 
J]rwxrwxrwx 1 root root 6 Mar 30 13:25 /sbin/mkfs.ext4 -> mke2fs 
J]rwxrwxrwx 1 root root 6 Mar 30 13:25 /sbin/mkfs.ext4dev -> mke2fs 
-IWXr-Xxr-x 1 root root 26200 Mar 29 21:49 /sbin/mkfs.minix 

Jrwxrwxrwx 1 root root 7 Dec 19 2011 /sbin/mkfs.msdos -> mkdosfs 
Jrwxrwxrwx 1 root root 6 Mar 5 2012 /sbin/mkfs.ntfs -> mkntfs 
lJrwxrwxrwx 1 root root 7 Dec 19 2011 /sbin/mkfs.vfat -> mkdosfs 


如 你 所 见 , mkfs.ext4 只 是 mke2fs 的 一 个 符号 链接 。 如 果 你 在 系统 中 没有 发 现 某 个 特定 的 mkfs 
命令 , 或 者 你 在 寻找 某 个 特定 的 文件 系统 类 型 ， 记 住 这 点 很 重要 。 文件 系统 创建 程序 都 有 自己 的 
使 用 手册 ， 如 mke2fs(8)， 在 大 部 分 情况 下 运行 mkfs .ext4(8) 将 会 重 定向 到 mke2fs(8)。 


4.2.3 ” 挂 载 文 件 系 统 


在 Unix 系 统 中 ， 我 们 称 挂 载 文件 系统 为 mounting。 系 统 启动 的 时 候 ， 内 核 根 据 配置 信息 挂 载 
root 目 录 /。 
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要 挂 载 文件 系统 ， 你 需要 了 解 以 下 几 点 。 

口 文件 系统 所 在 设备 〈 如 磁盘 分 区 ,文件 系统 数据 存放 的 位 置 

D 文件 系统 类 型 。 

口 挂 载 点 ， 也 就 是 当前 系统 目录 结构 中 挂 载 文件 系统 的 那个 位 置 。 挂 载 点 是 一 个 目录 ， 例 
如 ， 你 可 以 使 用 (cdrom 目 录 来 挂 载 CD-ROM。 挂 载 点 可 以 在 任何 位 置 ， 只 要 不 直接 在 /下 
即 可 。 

挂 载 文 件 系统 时 我 们 常 这 样 描述 :“ 将 x 设 备 挂 载 到 x 挂 载 点 。” 你 可 以 运行 mount 命 令 来 查看 
当前 文件 系统 状态 ， 如 : 


Mn 


o 


$ mount 

/dev/sdal on / type ext4 (rw,errors=remount-ro) 

proc on /proc type proc (rw,noexec, nosuid,nodev) 

sysfs on /sys type sysfs (rw,noexec,nosuid,nodev) 

none on /sys/fs/fuse/connections type fusectl (rw) 

none on /sys/kernel/debug type debugfs (rw) 

none on /sys/kernel/security type securityfs (rw) 

udev on /dev type devtmpfs (rw,mode=0755) 

devpts on /dev/pts type devpts (rw,noexec,nosuid,gid=5,mode=0620) 
tmpfs on /run type tmpfs (rw,noexec,nosuid,size=10%,mode=0755) 
-- Snip-- 


上 面 每 一 行 对 应 一 个 已 挂 载 的 文件 系统 ， 每 一 列 代表 的 信息 如 下 所 示 。 

口 设备 名 ， 如 /dev/sda3。 其 中 有 一 些 不 是 真实 的 设备 ( 如 proc )， 它 们 代表 一 些 特殊 用 途 的 
文件 系统 ， 不 需要 实际 的 设备 。 

口 单词 on。 

口 挂 载 点 。 

口 单词 type。 

口 文件 系统 类 型 ， 通常 是 一 个 短 标识 。 

口 挂 载 选 项 〈 使 用 括号 包围 ， 详 见 4.2.6 节 )。 

使 用 mount 命 令 带 参数 (文件 系统 类 别 、 设 备 及 所 需 的 挂 载 点 ) 来 挂 载 文件 系统 ， 如 下 所 示 : 


# mount -t type device mountpoint 


例如 要 挂 载 /dev/sd 人 2 设备 到 /home/extra， 可 以 运行 下 面 的 命令 : 


# mount -t ext4 /dev/sdf2 /home/extra 


一 般 情况 下 不 需要 指定 -t type 参 数 ，mount 命 令 可 以 自行 判断 。 然 而 有 时 候 需 要 在 类 似 的 文 
件 系统 中 明确 指定 一 个 ， 比 如 不 同 的 FAT 文 件 系 统 类 型 。 
在 4.2.6 节 我 们 将 介绍 更 多 选项 。 至 于 文件 系统 的 印 载 ， 你 可 以 使 用 umount 命 令 : 


# umount mountpoint 
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你 也 可 以 印 载 设备 而 不 是 挂 载 点 。 


4.2.4 文件 系统 UUID 


上 一 节 介 绍 的 挂 载 文件 系统 使 用 的 是 设备 名 。 然 而 设备 名 会 根据 内 核发 现 设 备 的 顺序 而 改 
变 ， 因 此 你 可 以 使 用 文件 系统 的 通用 唯一 标识 ( Universally Unique Identifier， 以 下 简称 UUID ) 
来 挂 载 。UUID 是 一 系列 的 数字 ， 并 且 保 证 每 个 唯一 。mke2fs 这 些 文件 系统 创建 程序 在 初始 化 文 
件 系统 数据 结构 时 会 生成 一 个 UUID。 

你 可 以 使 用 blkid (block ID ) 命令 查看 设备 和 其 对 应 的 文件 系统 及 UUID: 


# blkid 

/dev/sdf2: UUID="a9011c2b-1c03-4288-b3fe-8ba961ab0898" TYPE="ext4" 
/dev/sda1: UUID="70ccd6e7-6ae6-44{f6-812c-51aab8036d29" TYPE="ext4" 
/dev/sda5: UUID="592dcfd1-58da-4769-9ea8-5f412a896980" TYPE="swap" 
/dev/sde1: SEC TYPE="msdos" UUID="3762-6138" TYPE="vfat" 


上 例 中 blkid 发 现 了 四 个 分 区 ， 其 中 有 2 个 ext4、1 个 交换 分 区 ( 见 4.3 节 ) 以 及 1 个 FAT。Linux 
原生 分 区 都 有 标准 UUID， 但 是 FAT 分 区 没有 。FAT 分 区 可 以 通过 FAT 卷 序列 号 ( 本 例 中 是 
3762-6138 ) 来 引用 。 

使 用 UUID= 来 通过 UUID 挂 载 文件 系统 。 例 如 ， 要 把 上 例 中 的 第 一 个 文件 系统 挂 在 到 
/home/extra， 可 以 运行 如 下 命令 : 


# mount UUID=a9011c2b-1c03-4288-b3fe-8ba961ab0898 /home/extra 


通常 你 会 使 用 设备 名 来 挂 载 文 件 系 统 ， 因 为 这 比 UUID 容 易 。 但 是 理解 UUID 也 非常 重要 ,因为 
系统 启动 时 ( 见 4.2.8 节 ) 倾向 于 使 用 UUID 来 挂 载 文件 系统 。 此 外 ， 很 多 Linux 系 统 使 用 UUID 作 为 
可 移动 媒体 的 挂 载 点 。 上 例 中 的 FAT 文 件 系 统 就 是 在 一 个 闪存 卡 上 。Ubuntu 系 统 会 在 该 设备 插入 时 
将 这 个 分 区 挂 载 为 /media/3762-6138。udevd 守 护 进程 〈 见 第 3 章 ) 负责 处 理 设备 插入 的 初始 事件 。 
必要 时 你 可 以 更 改 文 件 系 统 的 UUID( 例如 你 拷贝 一 个 文件 系统 后 ， 需 要 区 分 原来 的 和 新 找 
贝 的 文件 时 )。 有 关 更 改 ext2/ext3/ext4 的 UUID 的 内 容 ， 你 可 以 参阅 tune2fs(8) 使 用 手册 。 


4.2.5 ”磁盘 缓冲 、 缓 存 和 文件 系统 


Linux 和 其 他 Unix 系 统一 样 ， 将 写 到 磁盘 的 数据 先 写 入 缓冲 区 。 这 意味 着 内 核 在 处 理 更 改 请 
求 的 时 候 不 直接 将 更 改写 到 文件 系统 ， 而 是 将 更 改 保存 到 RAM 中 直到 内 核能 够 便捷 地 将 更 改写 
到 磁盘 为 止 。 这 个 缓冲 机 制 能 够 带 来 性 能 上 的 提高 ， 对 用 户 来 说 是 透明 的 。 

当 你 使 用 umount 来 外 载 文件 系统 时 ， 内 核 自 动 和 磁盘 同步 。 另 外 你 还 可 以 随时 使 用 sync 命 令 
强制 内 核 将 缓冲 区 的 数据 写 到 磁盘 。 如 果 你 在 关闭 系统 之 前 由 于 种 种 原因 无 法 种 载 文 件 系 统 , 请 
务必 先 运行 sync 命 令 。 

此 外 ， 内核 有 一 系列 的 机 制 使 用 RAM 自 动 缓存 从 磁盘 读 取 的 数据 块 。 因 而 对 重复 访问 同一 个 
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文件 的 多 个 进程 来 说 , 内 核 不 用 反复 地 读 取 磁盘 , 而 只 需要 从 缓存 中 读 取 数 据 来 节省 时 间 和 资源 。 


4.2.6 文件 系统 挂 载 选项 


mount 命 令 的 更 改 有 很 多 选项 ,数量 还 不 少 ,通常 在 处 理 可 移动 设备 的 时 候 需要 用 到 .mount(8) 
使 用 手册 提供 了 详细 的 参考 信息 , 但 是 你 很 难 从 中 找 出 哪些 应 该 掌握 ,哪些 可 以 忽略 。 本 节 我 们 
介绍 一 些 比较 有 用 的 选项 。 
这 些 选 项 大 致 可 以 分 为 两 类 : 通用 类 和 文件 系统 相关 类 。 通用 选项 有 -t ( 指定 文件 系统 类 型 ， 
前 文 介绍 过 )。 文 件 系统 相关 选项 只 对 特定 的 文件 系统 类 型 适用 。 
文件 系统 相关 选项 使 用 方法 是 在 -o 后 加 选项 。 例 如 ，-o norock 在 ISO 9660 文 件 系统 上 关闭 
Rock Ridge 扩 展 ， 但 是 该 选项 对 其 他 文件 系统 类 型 无 效 。 
短 选项 
以 下 是 一 些 比 较 重 要 的 通用 选项 。 
口 -r: 该 选项 以 只 读 模 式 挂 载 文件 系统 ， 应 用 在 许多 场景 ， 如 写 保 护 和 系统 启动 。 在 挂 载 
只 读 设 备 (如 CD-ROM ) 的 时 候 ， 可 以 不 需要 设置 该 选项 ， 系 统 会 自动 设置 ( 还 会 提供 
只 读 设 备 状态 )。 
口 -n: 该 选项 确保 mount 命 令 不 会 更 新 系统 运行 时 的 挂 载 数据 库 /etc/mtab 。 如 果 无 法 成 功 写 
这 个 文件 ，mount 命 令 就 会 失败 。 因 为 系统 启动 时 root 分 区 (存放 系统 挂 载 数据 库 的 地 方 ) 
最 开始 是 只 读 的 ， 所 以 这 个 选项 十 分 重要 。 在 单 用 户 模 式 下 修复 系统 问题 时 这 个 选项 也 
很 有 用 ， 因 为 系统 挂 载 数据 库 也 许 在 那 时 会 不 可 用 。 
口 -t: -t type 选 项 指定 文件 系统 类 型 。 
长 选项 
短 选 项 对 越 来 越 多 的 挂 载 选项 来 说 明显 不 够 用 了 , 一 是 26 个 字母 无 法 容纳 所 有 选项 , 二 是 单 
个 字母 很 难说 明 选 项 的 功能 。 很 多 通用 选项 和 文件 系统 相关 选项 都 更 长 ， 格 式 也 更 灵活 。 
长 选项 的 使 用 方法 是 在 -o 后 加 关键 字 ， 见 下 例 ; 


# mount -t vfat /dev/hda1 /dos -o ro,conv=auto 


ro 和 conv=auto 是 两 个 长 选项 。ro 和 -Yr 一样 ， 设 定 只 读 模式 。conv=auto 告 诉 内 核 自 动 将 文本 
文件 从 DOS 格 式 转换 为 Unix 格 式 ( 稍 后 详细 介绍 )。 
以 下 是 比较 常用 的 长 选项 。 
口 exec、noexec: 允许 和 禁止 在 文件 系统 上 执行 程序 。 
口 suid、nosuid: 允许 和 禁止 setuid 程 序 。 
口 ro: 在 只 读 模 式 下 挂 载 文件 系统 ( 同 -r )。 
D rw: 在 读 写 模 式 下 挂 载 文件 系统 。 
口 conv=rule (FEAT 文件 系统 ): 根据 rule 规 则 转换 文件 中 的 换行 符 ,， rule 的 值 为 binary 、text 
或 auto， 默 认为 binary。binary 选 项 禁止 任何 字符 转换 。text 选 项 将 所 有 文件 当 作 文本 文 
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件 。auto 选 项 根据 文件 扩展 名 来 进行 转换 。 例如， 对 .jpg 文 件 不 做 任何 处 理 ， 而 对 .txt 文 件 
则 进行 转换 。 使 用 这 个 选项 时 需要 谨慎 ， 因 为 它 可 能 对 文件 造成 损坏 ， 可 以 考虑 在 只 读 
模式 中 使 用 。 


4.2.7 ”重新 挂 载 文 件 系 统 


有 时 候 你 可 能 由 于 需要 更 改 挂 载 选项 而 在 同一 挂 载 点 重新 挂 载 文件 系统 。 比 较 常 见 的 情况 是 
在 崩 演 恢 复 时 你 需要 将 只 读 文件 系统 改 为 可 写 。 

以 下 命令 以 可 读 写 模式 重新 挂 载 root ( 你 需要 -n 选 项 ， 因 为 mount 命 令 在 root 为 只 读 的 情况 下 
无 法 写 系统 挂 载 数 据 库 ): 


# mount -n -0 remount / 


该 命令 假定 /设备 在 目录 /etc/fstab 中 (下 节 将 会 介绍 )， 否 则 你 需要 指定 设备 。 
4.2.8 /etc/fstab 文 件 系统 表 


为 了 在 系统 启动 时 挂 载 文 件 系 统 和 降低 mount 命 令 的 使 用 ，Linux 系 统 在 /etc/fstab 中 永久 保存 
了 文件 系统 和 选项 列表 。 它 是 一 个 纯 文本 文件 ， 格 式 很 简单 ， 如 例 4-1 所 示 。 


例 4-1 /etc/fstab 中 的 文件 系统 和 选项 列表 


proc /proc proc nodev,noexec,nosuid 0 0 
UUID=70ccd6e7-6ae6-44f6-812c-51aab8036d29 / ext4 errors=remount-ro 0 1 
UUID=592dcfd1-58da-4769-9ea8-5f412a896980 none swap sw00 

/dev/sr0 /cdrom iso9660 ro,user,nosuid,noauto 0 0 


其 中 每 一 行 对 应 一 个 文件 系统 ， 且 每 一 行 有 6 个 字段 ， 从 左 至 右 分 别 如 下 所 示 。 
口 设备 或 者 UUID: 最 新 版 本 的 Linux 系 统 不 再 使 用 /etc/fstab 中 的 设备 ,而 是 使 用 UUID。( 请 
注意 ，/proc 这 一 行 有 一 个 名 为 proc 的 象征 性 设备 。 ) 
口 挂 载 点 : 指定 挂 载 文 件 系统 的 位 置 。 
口 文件 系统 类 型 : 你 可 能 在 列表 中 没 发 现 swap 字 样 ， 它 代表 交换 分 区 ( 见 4.3 节 )。 
口 选项 : 使 用 逗号 作为 长 选项 的 分 隔 符 。 
口 提供 给 dump 命 令 使 用 的 备份 信息 : 你 应 该 总 是 使 用 0。 
口 文件 系统 完整 性 测试 顺序 : 为 了 确保 fsck 总 是 第 一 个 在 root 上 运行 ， 对 root 文 件 系统 总 是 
将 其 设置 为 1， 硬 盘 上 的 其 他 文件 系统 设置 为 2。 使 用 0 来 禁止 其 他 启动 检查 ， 包 括 
CD-ROM 、 交 换 分 区 和 /proc 文 件 系统 ( 见 4.2.11 节 )。 

使 用 mount 时 ， 如 果 你 操作 的 文件 系统 在 /etc/fstab 中 的 话 ， 你 可 以 使 用 一 些 快捷 方式 。 例 如 ， 
如 果 你 在 使 用 例 4-1 挂 载 CD-ROM， 你 可 以 运行 hount /cdrom。 

使 用 以 下 命令 ， 你 可 以 挂 载 /etc/fstab 中 的 所 有 未 标识 为 noauto 的 设备 : 


# mount -a 
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例 4-1 中 有 一 些 新 选项 , 如 ertrors 、noauto 和 user， 因 为 它们 只 在 /etcfstab 文 件 中 适用 。 另 外 ， 

你 会 经 常 看 到 defaults 选 项 。 它 们 各 自 代 表 的 意思 如 下 所 示 。 

口 defaults: 该 选项 使 用 mount 的 默认 值 一 一 读 写 模式 、 启 动 设备 文件 、 可 执行 、setuid 等 等 。 

如 果 你 不 想 对 任何 列 设置 特殊 值 的 话 就 使 用 该 选项 。 

D errors: 这 是 ext2 相 关 人 参数， 用 来 定义 内 核 在 系统 挂 载 出 现 问题 时 的 行为 。 默 认 值 通常 是 
errors=continue ， 意 指 内 核 应 该 返回 错误 代码 并 且 继 续 运 行 。errors=remount-ro 是 告诉 
内 核 以 只 读 模 式 重新 挂 载 。errors=panic 使 内 核 在 挂 载 发 生 问 题 时 停止 。 

口 noauto: 该 选项 让 mount -a 命令 忽略 本 行 设备 。 可 以 使 用 这 个 选项 来 防止 在 系统 启动 时 挂 

载 可 移动 设备 如 CD-ROM 和 软盘 。 

D user: 这 个 选项 能 够 让 没有 权限 的 用 户 对 某 一 行 设 备 运行 mount 命 令 ， 对 访问 CD-ROM 这 
些 设备 来 说 比较 方便 。 因 为 用 户 可 以 通过 其 他 系统 在 移动 设备 上 放置 一 个 setuid-root 文 件 ， 
这 个 选项 也 设置 nosuid、noexec 和 nodev (用 来 阻止 特殊 的 设备 文件 )。 


4.2.9 /etc/fstab 的 替代 者 


一 直 以 来 我 们 都 使 用 /etc/fstab 来 管理 文件 系统 和 挂 载 点 ， 但 也 有 两 种 新 的 方式 。 一 是 
/etc/fstab.d 目 录 ， 其 中 包含 了 各 个 文件 系统 的 配置 文件 ( 每 个 文件 系统 有 一 个 文件 )。 该 目录 和 本 
书 中 你 见 到 的 其 他 配置 文件 目录 非常 类 似 。 

另 一 种 方式 是 为 文件 系统 配置 systemd 单 元 。 我 们 将 在 第 6 章 介绍 systemd 及 其 单元 。 不 过 ， 
systemd 单 元 配置 通常 是 由 或 者 说 基于 /etc/fstab 生 成 的 ， 所 以 你 可 能 会 发 现 一 些 重 芭 的 部 分 。 


4.2.10 文件 系统 容量 
你 可 以 使 用 df 命令 查看 当前 挂 载 的 文件 系统 的 容量 和 使 用 量 ， 如 下 例 所 示 : 


$ df 

Filesystem 1024-blocks Used Available Capacity Mounted on 
/dev/sdal 1011928 71400 889124 7% / 
/dev/sda3 17710044 9485296 7325108 56% /usr 


我 们 来 看 看 df 命令 输出 的 各 字段 的 含义 。 

D Filesystem: 指 文件 系统 设备 。 

口 1024-blocks: 指 文件 系统 的 总 容量 ， 以 每 块 1024 字 节 为 单位 。 

口 Used: 指 已 经 使 用 的 容量 。 

口 Available: 指 剩余 的 容量 。 

D Capacity: 指 已 经 使 用 容量 的 百分比 。 

口 Mounted on: 指 挂 载 点 。 

显而易见 ， 上 例 中 两 个 文件 系统 容量 分 别 为 1 GB 和 17.5 GB。 然 而 容量 数据 可 能 看 起 来 有 些 
奇怪 ， 因 为 71 400 加 889 124 不 等 于 1 011 928，9 485 296 也 不 是 17 710 044 的 56%。 这 是 因为 两 个 
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文件 系统 中 各 有 总 容量 的 5% 没 被 计算 在 内 ， 它 们 是 隐藏 的 预 留 块 。 所 以 只 有 超级 用 户 在 需要 时 
能 够 使 用 全 部 的 空间 。 这 个 特性 使 得 磁盘 空间 被 占 满 后 系统 不 会 马上 崩溃 。 

如 果 你 的 磁盘 空间 满 了 ,你 想 查 看 哪些 文件 占用 了 大 量 空间 ,可 以 使 用 du 命令 。 如 果 不 带 任 
何 参数 ，du 将 显示 当前 工作 目录 下 的 所 有 目录 的 磁盘 使 用 量 。( 你 可 以 运行 cd /; du 试 试看 ， 如 
果 你 看 够 了 可 以 按 Ctrl+C。) du -s 命 令 只 显示 合计 数 。 如 果 想 查看 某 个 特定 目录 的 容量 ， 可 以 切 
换 到 该 目录 ， 运 行 du -s * 来 查看 结果 。 


注解 POSIX 标 准 中 定义 每 个 块 大 小 是 512 字 节 。 然 而 这 对 于 用 户 来 说 不 容易 查看 ， 所 以 df 和 du 
的 输出 默认 以 1024 字 节 为 单位 。 如 果 你 想 使 用 POSIX 的 512 字 节 为 单位 ， 可 以 设置 
POSIXLY_CORRECT 环 境 变 量 。 也 可 以 使 用 -k 选 项 来 特别 指定 使 用 1024 字 节 块 (df 和 du 均 支 
持 )。df 还 有 一 个 -m 选 项 ， 用 于 以 1MB 为 单位 显示 容量 ，-h 则 是 自动 判断 和 使 用 对 用 户 来 
说 容易 理解 的 单位 。 


4.2.11 检查 和 修复 文件 系统 


Unix 文 件 系统 通过 一 个 复杂 的 数据 库 机 制 来 提供 性 能 优化 。 为 了 让 各 种 文件 系统 顺畅 地 工 
作 ， 内 核 必须 信任 加 载 的 文件 系统 不 会 出 错 。 如 果 出 错 则 会 导致 数据 丢失 和 系统 崩溃 。 

文件 系统 错误 通常 是 由 于 用 户 强 行 关 闭 系统 导致 (例如 直接 拔 掉 电 源 )。 此 时 文件 系统 在 内 
存 中 的 缓存 与 磁盘 上 的 数据 有 可 能 会 有 出 人 , 或 者 系统 有 可 能 正在 更 改 文 件 系 统 。 虽 然 新 的 文件 
系统 支持 日 志 功 能 来 防止 数据 损坏 , 你 仍然 要 使 用 恰当 的 方式 来 关闭 系统 。 文件 系统 检查 也 是 保 
证 数据 完整 的 必要 措施 。 

检查 文件 系统 的 工具 是 fsck。 对 于 mkfs 来 说 , fsck 对 每 个 Linux 支 持 的 文件 系统 类 型 都 有 一 个 
对 应 版 本 。 例 如 ， 当 你 在 扩展 文件 系统 ( ext2/ext3/ext4 ) 上 运行 fsck 时 ，fsck 检 测 到 文件 系统 类 
型 并且 启 动 e2fsck 工 具 。 所 以 通常 你 不 需要 自己 指定 e2fsck， 除 非 fsck 无 法 识别 文件 系统 类 型 
或 者 你 正在 查看 ezfsck 使 用 手册 。 

本 节 中 涉及 的 信息 是 针对 扩展 文件 系统 和 ez2fsck。 

要 在 手动 交互 模式 下 运行 fsck， 可 以 指定 设备 或 者 挂 载 点 〈/etc/fstab 中 ) 作为 参数 ， 如 : 


# fsck /dev/sdb1 


警告 ”不 可 以 在 一 个 已 经 挂 载 的 文件 系统 上 使 用 fsck， 因 为 内 核 在 你 执行 检查 时 有 可 能 更 新 磁 
盘 数 据 ， 导 致 运行 时 数据 不 匹配 ， 从 而 导致 系统 前 溃 和 文件 损坏 。 只 有 一 个 例外 ， 就 是 
你 使 用 单 用 户 只 读 模 式 挂 载 root 分 区 时 ， 可 以 在 上 面 使 用 fsck。 


在 手动 模式 下 ，fsck 会 输出 很 多 状态 信息 ， 如 下 所 示 : 
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Pass 1: Checking inode, blocks, and sizes 

Pass 2: Checking directory structure 

Pass 3: Checking directory connectivity 

Pass 4: Checking reference counts 

Pass 5: Checking group summary information 

/dev/sdb1: 11/1976 files (0.0% non-contiguous), 265/7891 blocks 


fsck 在 手动 模式 下 发 现 问题 会 停止 ,并 且 问 你 关于 如 何 修复 的 一 个 问题 。 问 题 涉 及 文件 系统 
的 内 部 结构 ,诸如 重新 连接 inode ( 它 是 文件 系统 的 基本 组 成 部 分 , 我们 将 在 4.5 节 介绍 )， 清 除 区 
块 等 。 如 果 fsck 问 你 是 否 重新 连接 inode, 说 明 它 发 现 了 一 个 未 命名 文件 。 在 重新 连接 这 个 文件 时 ， 
fsck 将 文件 放 到 lost+found 目 录 中 ， 并 使 用 一 个 数字 作为 文件 名 ， 因 为 原来 的 文件 名 很 可 能 已 经 
丢失 节点 ， 你 需要 根据 文件 内 容 为 文件 起 个 新 的 名 字 。 

如 果 你 仅仅 是 非 正常 关闭 了 系统 ,通常 不 需要 运行 fsck 来 修复 文件 系统 ， 因 为 fsck 可 能 会 产 
生 许 多 大 大 小 小 的 报错 。 还 好 e2fsck 有 一 个 选项 -p 能 够 自动 修复 常见 的 错误 ， 遇 到 严重 错误 时 则 
会 终止 。 实 际 上 很 多 Linux 发 行 版 在 启动 时 会 运行 各 自 的 fsck -p 版 本 。( 你 可 能 还 见 过 fsck -a， 
它 的 功能 是 一 样 的 。) 

如 果 你 觉得 系统 出 现 了 一 个 严重 的 问题 ， 比 如 硬件 故障 或 者 设备 配置 错误 , 这 时 就 需要 仔细 
其 酌 如 何 采 取 相 应 措施 ， 因 为 fsck 有 可 能 会 带 倒 忙 。( 如 果 fsck 在 手动 模式 下 向 你 提出 许多 问题 ， 
可 能 意味 着 系统 出 现 了 很 严重 的 问题 。) 

如 果 你 觉得 系统 出 现 了 很 严重 的 故障 ， 可 以 运行 fsck -n 来 检查 文件 系统 ， 同 时 不 做 任何 更 
改 。 如 果 问 题 出 在 设备 配置 方面 , 并 且 你 能 够 修复 ( 比如 分 区 表 中 的 块 数 目 不 正 确 或 者 数据 线 没 
插 稳 )， 那 就 请 在 运行 fsck 之 前 修复 它 ， 否 则 你 有 可 能 丢失 很 多 数据 。 

如 果 你 认为 超级 块 被 损坏 了 ( 比如 有 人 在 磁盘 分 区 最 开始 的 位 置 写 入 了 数据 )， 你 可 以 使 用 
mkfs 创 建 的 超级 块 备份 来 恢复 文件 系统 。 你 可 以 运行 fsck -b num 命 令 ， 以 使 用 位 于 num 的 块 来 蔡 
换 损 坏 的 超级 块 。 

如 果 你 不 知道 在 哪里 能 找到 备份 超级 块 ， 可 以 运行 mkfs -n 来 查看 备份 超级 块 列表 ， 这 不 会 
损失 任何 数据 。( 再 次 强调 ， 你 必须 使 用 -n 选 项 ， 和 否则 真 的 会 损坏 文件 系统 。) 

检查 ext3 和 ext4 文 件 系 统 

一 般 情况 下 ， 你 不 需要 手动 检查 ext3 和 ext4 文 件 系 统 ， 因 为 日 志保 证 了 数据 完整 性 。 然 而 ， 
你 可 能 想 要 在 ext2 模 式 中 挂 载 一 个 已 损坏 的 ext3 或 者 ext4 文 件 系 统 ,因为 内 核 无 法 使 用 非 空 日 志 3 
挂 载 ext3 和 ext4 文 件 系统 。( 如 果 你 没有 正常 关闭 系统 的 话 ， 日 志 里 有 可 能 会 残留 数据 。) 你 可 以 
运行 以 下 e2fsck 命 令 来 将 ext3 和 ext4 文 件 系统 中 的 日 志 数 据 写 人 到 数据 库 。 


# e2fsck -fy /dev/disk device 


最 坏 的 情况 

面 对 严 重 的 磁盘 故障 ， 你 可 以 有 下 面 的 选择 。 

口 你 可 以 使 用 dd 尝试 从 磁盘 提取 出 整个 文件 系统 的 映像 ， 然 后 将 它 转移 到 男 一 块 磁盘 的 相 
同 大 小 的 分 区 中 。 
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口 你 可 以 在 只 读 模式 下 挂 载 文件 系统 ， 然 后 再 想 办 法 修复 。 
口 使 用 debugfs。 
对 于 前 两 个 选项 , 你 必须 先 修复 文件 系统 , 然后 才能 挂 载 它 , 除非 你 愿意 手动 遍历 磁盘 数据 。 
你 可 以 使 用 fsck -y 来 回答 所 有 的 fsck 提 示 ， 不 过 如 果 不 是 迫不得已 不 要 使 用 这 个 方法 ， 因 为 它 
能 带 来 更 多 的 问题 ， 还 不 如 你 手动 处 理 。 
debugfs 工 具 能 够 让 你 遍历 文件 系统 中 的 文件 ， 并 将 它们 复制 到 其 他 地 方 。 默 认 情 况 下 ， 它 在 
只 读 模 式 下 打开 文件 系统 。 如 果 你 要 恢复 数据 的 话 , 最 好 确保 文件 的 完整 性 , 以 免 让 事情 变 得 更 粳 。 
最 坏 的 情况 下 ， 比 如 磁盘 严重 损坏 并 且 没 有 备份 , 你 能 做 的 也 只 能 是 向 专业 的 数据 修复 服务 
商 寻求 帮助 了 。 


4.2.12 ”特殊 用 途 的 文件 系统 


文件 系统 并 不 仅仅 用 于 存储 在 物理 媒介 上 的 数据 。 大 多 数 Unix 系 统 中 都 有 一 些 作为 系统 接口 
来 使 用 的 文件 系统 。 也 就 是 说 , 文件 系统 不 仅仅 为 在 存储 设备 上 存储 数据 提供 服务 ,还 能 够 用 来 
表示 系统 信息 ， 如 PID 和 内 核 诊 断 信 息 。 这 个 思路 和 /dev 类 似 ， 即 使 用 文件 作为 WO 接口 。/proc 出 
自 research Unix 的 第 八 版 ， 由 TomJ. Killian 实 现 ， 在 Bell 实 验 室 ( 其 中 有 很 多 最 初 的 Unix 设 计 者 ) 
创造 Plan 9 的 时 候 得 以 促进 。Plan 9 是 一 个 科研 用 操作 系统 , 它 将 文件 系统 的 抽象 程度 提升 到 了 一 
个 新 的 高 度 (http://plan9.bell-labs.com/sys/doc/9.html )。 

Linux 中 特殊 用 途 的 文件 系统 有 以 下 类 型 。 

口 proc: 挂 载 在 /proc。proc 是 进程 (process ) 的 缩写 。/proc 目 录 中 的 子 目录 以 系统 中 的 PID 
命名 ， 子 目录 中 的 文件 代表 的 是 进程 的 各 种 状态 。 文 件 /proc/self 表 示 当 前 进程 。Linux 系 
统 的 proc 文 件 系统 包括 大 量 的 内 核 和 硬件 系统 信息 , 保存 在 像 proc/cpuinfo 这 样 的 文件 中 。 
(后 来 有 人 提出 将 进程 无 关 的 信息 从 /proc 移 至 /sys。 ) 

口 sysfs: 挂 载 在 /sys( 在 第 3 章 已 经 介绍 过 )。 

口 tmpfs: 挂 载 在 /run 和 其 他 位 置 。 通 过 tmpfs, 你 可 以 将 物理 内 存 和 交换 空间 作为 临时 存储 。 
例如 ， 你 可 以 将 tmpfs 挂 载 到 任意 位 置 ， 使 用 size 和 nr_blocks 长 选项 来 设置 最 大 容量 。 但 

是 请 注意 不 要 经 常 随意 地 将 数据 存放 到 tmpfs， 这 样 你 很 容易 占 满 系统 内 存 ， 会 导致 程序 

月 演 。( 多 年 来 ，Sun Microsystems 公 司 使 用 的 tmpfs 在 长 时 间 运 行 后 会 导致 一 系列 问题 。) 


4.3 ”交换 空间 


并 不 是 所 有 磁盘 分 区 都 包含 文件 系统 。 系统 可 以 通过 使 用 磁盘 空间 来 扩展 内 存 容量 。 如 果 出 
现 内 存 空间 不 足 的 情况 ，Linux 虚 拟 内 存 系统 会 自动 将 内 存 中 的 进程 移出 至 磁盘 以 及 从 磁盘 移 人 
内 存 。 我 们 称 其 为 交换 (swap )， 因 为 空闲 的 进程 被 移出 到 磁盘 ， 同 时 被 激活 的 进程 从 磁盘 移 人 
到 内 存 。 用 来 保存 内 存 页 面 的 磁盘 空间 我 们 称 为 交换 空间 ( swap space， 或 简称 swap )。 

使 用 free 命 令 可 以 显示 当前 交换 空间 的 使 用 情况 : 


-| 
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$ free 

total Used free 
-- Snip-- 
Swap: 514072 189804 324268 


4.3.1 使 用 磁盘 分 区 作为 交换 空间 


通过 以 下 步 又 来 将 整个 磁盘 分 区 作为 交换 空间 。 
(1) 确保 分 区 为 空 
(2) 运行 mkswap dev， 其 中 dev 是 分 区 设备 。 该 命令 在 分 区 上 放置 一 个 交换 签名 。 
(3) 运行 swapon dev 向 内 核 注 册 。 
交换 分 区 创建 后 ， 你 可 以 在 /etc/fstab 文 件 中 创建 一 个 新 的 交换 条 目 ， 这 样 系统 在 重启 之 后 即 
可 使 用 该 交换 空间 。 以 下 是 一 个 条 目的 样 例 ， 使 用 /dev/sda5 作 为 交换 分 


/dev/sda5 none swap sw 0 0 


请 记 住 ， 现 在 很 多 系统 使 用 的 是 UUID 而 非 原始 设备 名 。 


4.3.2 ”使 用 文件 作为 交换 空间 


如 果 不 想 重新 分 区 或 者 不 想 新 建交 换 分 区 的 话 , 你 可 以 使 用 常规 文件 作为 交换 空间 , 它们 的 
效果 是 一 样 的 。 

具体 步骤 为 创建 一 个 空 文件 ,将 其 初始 化 为 交换 空间 ,然后 将 其 加 入 交换 池 。 所 用 的 代码 如 
下 例 所 示 : 


# dd if=/dev/zero of=swap_ file bs=1024k count=num mb 
# mkswap swap_file 
# swapon swap_ file 


这 里 swap_file 是 新 交换 文件 的 名 称 ，num_mb 是 需要 的 文件 大 小 ， 以 MB 为 单位 。 
可 以 使 用 swapoff 命 令 来 删除 交换 分 区 或 交换 文件 。 


4.3.3 ”你 需要 多 大 的 交换 空间 

以 前 Unix 系 统 建 议 将 交换 空间 大 小 设置 为 内 存 容 量 的 至 少 两 倍 。 如 今 内 存 和 磁盘 空间 都 不 再 
是 问题 , 关键 看 我 们 怎样 使 用 系统 。 一 方面 ， Cs x 间 让 我 们 可 以 分 配 超过 两 倍 内 存 的 交 
换 空间 ， 另 一 方面 ， 内 存 大 到 我 们 根本 不 需要 交换 空间 。 

“两 倍 内 存 容量 ”这 一 规则 对 于 多 个 用 户 系统 来 说 就 显得 过 时 了 。 由 于 并 不 是 所 有 用 户 都 处 
于 活跃 状态 ,最 好 能 够 将 非 活 唉 用 户 的 内 存 交换 给 那些 有 需要 的 活跃 用户 。 

对 于 单 用 户 系统 来 说 ， 此 规则 仍 适 用 。 如 果 你 在 运行 多 个 进程 ， 可 以 交换 不 活跃 进程 ， 甚 至 
交换 活跃 进程 中 的 那些 不 活跃 部 分 都 没 问 题 。 如果 许多 活路 进程 同时 都 需要 内 存 , 因而 必须 频繁 
地 使 用 交换 空间 ， 这 时 你 会 磁 到 非常 严重 的 性 能 问题 ， 因 为 磁盘 IO 速度 相对 较 慢 。 唯 一 的 解决 
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办 法 就 是 增加 更 多 内 存 ， 终 止 一 些 进程 ， 或 者 吐槽 一 下 。 
有 时 候 Linux 内 核 可 能 会 为 了 获得 磁盘 缓冲 而 交换 出 一 个 进程 。 为 了 防止 这 种 情况 ， 有 些 系 


统管 理 员 将 系统 设置 为 不 允许 交换 空间 。 例 如 , 高 性 能 网 络 服务 器 需要 尽 可 能 避免 磁盘 存 取 和 交 
换 空 间 0 


注解 ”如 果 系 统 耗 尽 了 所 有 的 物理 内 存 和 交换 空间 ，Linux 内 核 会 调用 out-ofmemory ( OOM ) 
来 终止 一 个 进程 以 获得 一 些 内 存 空间 。 你 应 该 不 希望 你 的 桌面 应 用 程序 被 这 样 终止 。 另 
一 方面 ， 高 性 能 服务 器 有 复杂 的 监控 和 负载 平衡 系统 来 保证 内 存 不 会 被 完全 耗 尽 。 


我 们 将 在 第 8 章 详细 介绍 内 存 系统 。 


4.4 ”前 颇 : 磁盘 和 用 户 空间 


对 于 Unix 系 统 上 那些 磁盘 相关 的 组 件 , 我 们 很 难 界 定 用 户 空间 和 内 核 空 间 的 边界 。 内 核 处 理 
设备 上 的 基本 块 TO， 用 户 空 间 工 具 可 以 通过 设备 文件 来 使 用 块 JO。 然 而 ， 用 户 空 间 通常 只 使 用 
块 1O 做 一 些 初始 化 操作 ， 比 如 分 区 、 创 建文 件 系 统 和 创建 交换 分 区 。 一 般 情况 下 ， 用 户 空间 只 
在 块 VO 的 基础 上 使 用 内 核 提 供 的 文件 系统 支持 。 类 似 地 ， 内 核 在 虚拟 内 存 系统 中 人 处理 交换 空间 
时 也 负责 处 理 大 部 分 繁琐 的 细节 。 

本 章 后 面 的 内 容 将 简要 介绍 Linux 文 件 系 统 的 内 部 结构 。 这 些 内 容 主要 针对 高 级 用 户 ， 不 影 
响 普通 读者 的 阅读 ， 你 可 以 直接 跳 到 下 一 章 学 习 Linux 的 启动 。 


4.5 深入 传统 文件 系统 


传统 的 Unix 文 件 系统 有 两 个 基础 组 件 : 一 个 用 来 存储 数据 的 数据 块 池 和 一 个 用 来 管理 数据 池 
的 数据 库 系 统 。 这 个 数据 库 是 inode 数 据 结构 的 核心 。inode 是 一 组 描述 文件 的 数据 ， 包 括 文件 类 
型 、 权 限 ， 以 及 最 重要 的 一 点 ， 即 文件 数据 所 在 的 数据 池 。inode 在 inode 表 中 以 数字 的 形式 表示 。 

文件 名 和 目录 也 是 通过 inode 来 实现 的 。 目 录 inode 包 含 一 个 文件 名 列表 以 及 对 应 的 指向 其 他 
inode 的 链接 。 

为 了 方便 举例 ,我 们 来 创建 一 个 新 的 文件 系统 ， 挂 载 它 ， 并 切换 到 挂 载 点 目录 。 然后 加 入 一 
些 文件 和 目录 (你 可 以 在 一 个 内 存盘 上 来 做 实验 ): 


$ mkdir dir 1 

$ mkdir dir 2 

$ echo a > dir 1/file 1 
$ echo b > dir 1/file 2 
$ echo c > dir 1/file 3 
$ echo d > dir 2/file 4 

$ ln dir 1/file 3 dir 2/file 5 
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这 里 我 们 创建 了 一 个 硬 链接 dir 2/file 5， 指 向 dir_1/file 3， 它 们 实际 上 代表 的 是 同一 个 文件 
( 稍 后 详 述 )。 

从 用 户 角度 而 言 ， 该 文件 系统 的 目录 结构 如 图 4-4 所 示 。 而 图 4-5 更 为 复杂 ， 显 示 的 是 真实 的 
文件 系统 结构 。 


(root) 


dir_1 dir 2 


file_1 file 2| |file 3 file 4| |file 5 


图 4-4 用户 眼中 的 文件 系统 


inode 表 
#/link count/type 数据 池 


inode2 
inode 12 
inode 7633 


inode 12 
inode2 
file_1 inode 13 
file 2 inode 14 
file 3 inode 15 


inode 7633 
inode2 
inode 16 
inode 15 


图 4-5 图 4-4 对 应 的 inode 文 件 系统 结构 
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我 们 如 何 来 理解 这 个 图 呢 ?” 对 ext2/3/4 文 件 系 统 来 说 , 编号 为 2 的 inode 是 root inode, 它 是 一 个 
目录 inode( 即 dir )。 如 果 跟 随 箭头 到 数据 池 ， 我 们 可 以 看 到 root 目 录 的 内 容 : dir_1 和 dir 2 两 个 条 
目 分 别 对 应 inode 12 和 7633。 我 们 也 可 以 回 到 inode 表 查看 这 两 个 inode 的 详细 内 容 。 

内 核 采 取 以 下 步 又 来 对 dir_ lfile 2 做 检查 。 

(1) 检查 路 径 部 分 ， 即 目录 dir_ 1 和 后 面 的 file 2。 

(2) 通过 root inode 找 到 它 的 目录 信息 。 

(3) 在 inode 2 的 目录 信息 中 找到 dir 1， 它 指向 inode 12。 

(4) 在 inode 表 中 查找 inode 12， 验 证 它 是 一 个 目录 。 

(5) 找到 inode 12 的 目录 信息 ( 在 数据 池 中 )。 

(6) 在 inode 12 的 目录 信息 中 找到 file 2， 它 指向 inode 14。 

(7) 在 目录 表 中 查找 inode 14， 它 是 一 个 文件 inode。 

至 此 ， 内 核 了 解 了 该 文件 的 属性 ， 可 以 通过 inode 14 的 数据 链接 打开 它 了 。 通 过 这 种 方式 ， 
inode 指 向 目录 数据 结构 ， 目 录 数 据 结 构 也 指向 inode， 这 样 你 可 以 根据 自己 的 习惯 创建 文件 系统 
结构 。 另 外 请 注意 目录 inode 中 包含 了 .和 .. 两 个 条 目 ( 除 root 目 录 以 外 ), 让 你 能 够 轻松 地 在 目录 结 
构 中 浏览 。 


4.5.1 查看 inode 细 节 


我 们 可 以 使 用 命令 1s -i 来 查看 目录 的 inode 编 号 。 例 如 上 例 中 的 目录 inode 编 号 如 下 所 示 ( 可 
以 使 用 stat 命 令 来 查看 更 详细 的 信息 ): 


$ 1s -i 
12 dir 1 7633 dir 2 


你 可 能 在 1s -1 命令 的 结果 中 见 过 但 忽略 了 链接 计数 (link count ) 这 个 信息 ， 图 4-5 中 文件 的 
链接 计数 是 多 少 呢 ， 特 别 是 硬 链 接 file 5? 链接 计数 是 指向 同一 个 inode 的 所 有 目录 条 目的 总 数 。 
大 多 数 文件 的 链接 计数 是 1， 因 为 它们 大 多 在 目录 条 目 里 只 出 现 一 次 。 这 不 奇怪 ， 因 为 通常 当 你 
创建 一 个 新 文件 的 时 候 ， 你 只 为 其 创建 一 个 新 的 目录 条 目 和 一 个 新 的 inode。 然 而 inode15 出 现 了 
两 次 : 一 次 是 dir_ lfile 3， 另 一 次 是 dir 2/file 5$。 硬 链接 是 手动 创建 的 、 指 向 一 个 已 有 的 inode 的 
目录 条 目 。 使 用 ln 命令 (不 带 -s 选 项 ) 可 以 创建 新 链接 。 

这 就 是 为 什么 我 们 有 时 候 将 删除 文件 称 为 取消 链接 。 如 果 你 运行 rm dir_1/file 2， 内 核 会 在 
inode 12 的 目录 条 目 中 搜索 名 为 file_2 的 条 目 。 当 发 现 file_2 对 应 inode 14 的 时 候 ， 内 核 删 除 目 录 条 
目 , 同时 将 inode 14 的 链接 计数 减 1。 这 导致 node 14 的 链接 计数 为 0, 内 核发 现 该 inode 没 有 任何 链 
接 的 时 候 ， 会 将 其 和 与 之 相关 的 所 有 数据 删除 。 

但 是 如 果 你 运行 zm dir 1/file 3，inode 15 的 链接 计数 会 由 2 变 为 1 (dir 2/file 5 仍然 与 之 链 
接 )， 这 时 内 核 不 会 删除 此 inode。 

链接 计数 对 于 目录 来 说 也 是 同 理 。inode 12 的 链接 计数 为 2, 一 个 是 目录 条 目 中 的 dir_ 1 (inode 
2 )， 男 一 个 是 它 自己 的 目录 条 目 中 的 自 引 用 (.)。 如 果 你 创建 一 个 新 目录 dir_1/dir 3，inode 12 的 
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链接 计数 会 变 为 3， 因 为 新 目录 包含 其 上 级 目录 (.. ) 条 目 ， 而 这 个 条 目 又 链接 到 inode 12。 类 似 
inode 12 指 向 其 上 级 目录 inode 2。 

有 一 种 情况 比较 特殊 ，root 目 录 的 inode 2 的 链接 计数 为 4。 而 图 4-5 中 只 显示 了 3 个 目录 条 目 链 
接 。 另 外 一 个 其 实 是 文件 系统 的 超级 块 ， 它 知道 如 何 找到 root inode。 

你 完全 可 以 自己 做 一 些 尝试 ， 使 用 1s -i 创 建文 件 系 统 ， 使 用 stat 来 遍历 ， 这 些 操作 都 很 安 
全 。 你 也 不 需要 使 用 root 权 限 〈 除非 你 需要 挂 载 和 创建 新 的 文件 系统 )。 

有 一 个 地 方 我 们 还 没有 讲 到 ,就 是 在 为 新 文件 分 配 数据 池 块 的 时 候 , 文件 系统 如 何 知 道 哪些 
块 可 用 ， 哪 些 已 被 占用 ”方法 之 一 是 使 用 块 位 图 (block bitmap ) 来 管理 块 信息 。 文 件 系 统 保留 
了 一 些 字 节 空间 ， 每 一 位 代表 一 个 数据 池 中 的 一 个 块 。0 代 表 块 可 用 ，1 代 表 块 已 经 被 占用 ， 释 放 
和 分 配 块 就 变 成 了 0 和 1 之 间 的 切换 。 

当 inode 表 中 的 数据 和 块 分 配 数据 不 匹配 ， 或 者 由 于 你 没有 正确 关闭 系统 导致 链接 数目 不 正 
确 , 文件 系统 就 会 出 错 。 所 以 你 在 检查 文件 系统 的 时 候 , 如 4.1.11 节 介绍 的 那样 ,fsck 会 遍历 inode 
表 和 目录 结构 来 生成 链接 数目 和 块 分 配 信息 , 并 且 会 根据 磁盘 上 的 文件 系统 来 检查 新 数据 ， 如 果 
发 现 数据 不 匹配 的 情况 ,fsck 会 修复 链接 数 错误 以 及 inode 和 其 他 一 些 目录 结构 数据 错误 。 大 部 分 
fsck 程 序 会 将 新 创建 的 文件 放 到 lost+found 目 录 。 


4.5.2 ”在 用 户 空 间 中 使 用 文件 系统 


在 用 户 空间 中 使 用 文件 和 目录 时 , 你 不 需要 太 关心 底层 实现 的 细节 。 你 只 需要 能 够 通过 内 核 
系统 调用 来 访问 文件 和 目录 的 内 容 。 其 实 你 也 能 够 看 到 一 些 看 似 超出 用 户 空间 范围 的 文件 系统 信 
息 ， 特 别 是 stat() 这 个 系统 调用 能 够 告诉 你 inode 数 目 和 链接 计数 。 

除非 你 需要 维护 文件 系统 ， 否 则 你 不 需要 知道 inode 数 目 和 链接 计数 。 用 户 模式 中 的 程序 之 
所 以 能 够 访问 这 些 信 息 ， 主 要 是 因为 一 些 向 后 兼容 的 考虑 。 并 且 也 不 是 所 有 Linux 的 文件 系统 都 
提供 这 些 信息 。VFS 接 口 层 能 够 确保 系统 调用 总 是 返回 inode 数 目 和 链接 计数 , 不 过 这 些 数据 可 能 
没有 太 大 意义 。 

在 传统 文件 系统 上 你 有 可 能 无 法 执行 一 些 传统 的 Unix 文 件 系统 的 操作 。 比 如 ,你 无 法 使 用 ln 
命令 在 VFAT 文 件 系统 上 创建 硬 链 接 ， 因 为 其 目录 条 目 数据 结构 根本 不 同 。 

幸运 的 是 Unix/Linux 提 供给 用 户 空 间 的 系统 调用 为 用 户 访问 文件 提供 了 足够 的 便利 ， 用 户 不 
需要 关心 任何 底层 的 细节 。 文件 命名 很 灵活 ,支持 大 小 写 混合 , 并 且 能 很 容易 地 支持 其 他 文件 系 
统 结 构 。 

请 记 住 ， 内 核 只 是 系统 调用 的 通道 ， 而 不 会 包含 对 某 个 特定 的 文件 系统 的 支持 。 


4.5.3 文件 系统 的 演进 


你 已 经 看 到 了 ， 就 算 一 个 很 简单 的 文件 系统 也 包括 各 种 各 样 不 同 的 组 件 ， 需 要 去 维护 。 同 时 
随 着 新 需求 、 新 技术 和 存储 容量 的 不 断 发 展 ， 用 户 对 文件 系统 的 要 求 也 越 来 越 高 。 如 今 ， 性 能 、 
数据 完整 性 、 安 全 性 等 方面 的 需求 大 大 超出 了 老式 文件 系统 的 功能 范围 , 因而 文件 系统 方面 的 技 


[sm 
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术 也 在 日 新 月 异地 发 展 。 一 个 例子 就 是 我 们 在 4.2.1 广 中 提 到 的 Btrfs。 

文件 系统 演进 的 男 一 个 例子 是 新 的 文件 系统 使 用 不 同 的 数据 结构 来 表示 文件 和 目录 。 它们 使 
用 数据 块 的 方式 各 不 相同 ， 而 不 是 使 用 本 章 介绍 的 inode。 此 外 , 针对 SSD 优 化 的 文件 系统 也 在 不 
断 演 进 。 但 无 论 怎么 变化 ， 归 根 结 底 它 们 的 最 终 目 的 都 是 一 样 的 。 
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Linux 内 核 的 局 动 


目前 为 止 ， 我们 介绍 了 Linux 系 统 的 物理 结构 和 逻辑 结 
构 、 内 核 以 及 进程 。 本 章 我 们 将 讨论 内 核 的 启动 ， 即 从 内 核 
载 入 内 存 到 启动 第 一 个 用 户 进程 的 过 程 。 


下 面 是 简化 后 的 整个 启动 过 程 。 

(1) BIOS 或 者 启动 固件 加 载 并 运行 引导 装载 程序 。 

(2) 引导 装载 程序 在 磁盘 上 找到 内 核 映 像 ， 将 其 载 信 内存 并 启动 。 

(3) 内 核 初始 化 设备 及 其 驱动 程序 。 

(4) 内 核 挂 载 root 文 件 系 统 。 

(5) 内 核 使 用 PID 1 来 运行 一 个 叫 init 的 程序 ， 用 户 空间 在 此 时 开始 启动 。 

(6) init 启 动 其 他 的 系统 进程 。 

(7) init 还 会 启动 一 个 进程 ， 通 常 发 生 在 整个 过 程 的 尾声 ， 负 责 用 户 登 录 。 

本 章 涉及 前 4 个 步 又 ， 主 要 介绍 内 核 和 引导 装载 程序 。 在 第 6 章 我 们 会 介绍 用 户 空间 启动 。 

理解 启动 过 程 对 将 来 修复 启动 相关 的 问题 会 大 有 帮助 , 也 有 助 于 了 解 整个 Linux 系 统 。 然 而 ， 
你 很 难 从 Linux 系 统 的 默认 启动 过 程 中 分 辨 出 最 前 面 的 几 个 步 又 ， 通 党 只 有 在 整个 过 程 完 成 ， 你 
登录 系统 后 才 有 机 会 看 到 。 


5.1 启动 消息 


传统 的 Unix 系 统 在 启动 时 会 显示 很 多 系统 信息 , 方便 你 查看 启动 过 程 。 这 些 消 息 一 开始 来 自 
内 核 ， 然 后 是 进程 和 init 执 行 的 初始 化 程序 。 然 而 ， 这 些 消息 格式 不 是 那么 清晰 和 一 致 ， 有 时 其 
至 不 是 那么 有 用 。 现 在 大 部 分 Linux 发 行 版 都 使 用 启动 屏幕 、 屏 幕 填充 色 和 启动 选项 菜单 将 它们 
遮盖 住 。 此 外 , 硬件 性 能 的 提升 也 让 启动 过 程 更 快 , 这 些 消息 显示 得 也 更 快 , 快 到 让 人 难以 捕捉 。 
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有 两 种 方法 可 以 查看 内 核 启动 信息 和 运行 时 的 诊断 信息 。 

口 查看 内 核 系 统 日 志文 件 。 这 些 文件 通常 存放 在 /var/log/kern.log 中 ， 取 决 于 你 的 系统 配置 ， 

也 可 能 和 其 他 系统 日 志 一 起 存放 在 /var/log/messages 或 者 别 的 地 方 。 

口 使 用 dmesg 命 令 ， 不 过 记得 将 结果 输出 到 less， 因 为 信息 量 会 比较 大 。dmesg 命 令 使 用 内 核 
环 缓冲 区 ， 它 的 容量 有 限 ， 不 过 大 多 数 较 新 的 内 核能 够 有 足够 的 空间 来 容纳 足够 长 的 启 
动 日 志 。 

以 下 是 一 个 dmesg 的 示例 。 


-- Snip-- 


dmesg 


0.000000] Initializing cgroup subsys cpu 
0.000000] Linux version 3.2.0-67-generic-pae (buildd@toyol) (gcc version 4. 


.3 (Ubuntu/Linaro 4.6.3-1ubuntu5) ) #101-Ubuntu SMP Tue Jul 15 18:04:54 UTC 2014 
(Ubuntu 3.2.0-67.101-generic-pae 3.2.60) 


0.000000] KERNEL supported cpus: 


2.986148] sr0: scsi3-mmc drive: 24x/8x writer dvd-ram cd/rw xa/form2 cdda tray 
2.986153] cdrom: Uniform CD-ROM driver Revision: 3.20 

2.986316] sr 1:0:0:0: Attached scsi CD-ROM sr0 

2.986416] sr 1:0:0:0: Attached scsi generic sg1 type 5 

3.007862] sda: sda1 sda2 < sda5 > 

3.008658] sd 0:0:0:0: [sda] Attached SCSI disk 


-- Snip-- 


内 核 启动 后 ,用 户 空间 启动 程序 会 产生 消息 。 查 看 这 些 消 息 不 是 很 方便 ,因为 它们 分 布 在 很 


多 不 同 的 地 方 。 启 动 脚本 通常 会 将 消息 显示 到 屏幕 上 ,启动 完成 后 就 从 屏幕 上 消失 了 。 但 这 也 不 


是 大 问题 ,因为 每 个 脚本 都 将 消息 写 入 它们 各 自 的 日 志 。 有 一 些 版 本 的 init, 比如 Upstart 和 systemd， 


可 以 获得 那些 显示 到 屏幕 的 启动 和 运行 时 消息 。 


5.2 ”内 核 初始 化 和 启动 选项 


在 启动 时 ，Linux 内 核 的 初始 化 过 程 如 下 : 

(1) 检查 CPU; 

(2) 检查 内 存 ; 

(3) 检测 设备 总 线 ; 

(4) 检测 设备 ; 

(5) 设置 附加 内 核子 系统 ( 如 网 络 等 ); 

(6) 挂 载 root 目 录 ; 

(7) 启动 用 户 空间 。 

前 面 几 个 步骤 很 好 理解 , 设备 相关 的 步骤 则 涉及 一 些 依赖 性 问题 。 例 如 磁盘 设备 驱动 程序 可 


能 需要 依赖 于 总 线 和 SCSI 子 系统 的 支持 。 


在 后 面 的 几 个 步 双 中， 内核 必须 在 初始 化 前 挂 载 root 文 件 系统 。 你 可 以 忽略 大 部 分 细节 ， 除 
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了 一 点 ,就 是 一 些 组 件 并 不 是 主 内 核 的 一 部 分 , 它们 会 以 可 加 载 内 核 模块 的 方式 启动 。 0 系 
统 中 ， 你 可 能 需要 在 挂 载 root 文 件 系 统 之 前 加 载 这 些 内 核 模块 。 详 细 内 容 我 们 将 在 6.8 节 介 

直到 本 书写 成 时 , 内 核 在 启动 第 一 个 用 户 进程 时 不 会 显示 任何 消息 。 然而 下 面 的 这 些 与 内 存 
管理 相关 的 消息 能 够 为 我 们 提供 一 些 信息 , 内 核 将 自己 的 内 存 空间 保护 起 来 以 防止 用 户 空间 进程 
使 用 。 下 面 这 些 信息 预示 着 用 户 空 间 即 将 启动 : 


Freeing unused kernel memory: 740k freed 

Write protecting the kernel text: 5820k 

Write protecting the kernel read-only data: 2376k 
NX-protecting the kernel data: 4420k 


这 时 你 还 可 以 看 到 root 文 件 系统 的 挂 载 信息 。 


注解 ”本 章 下 面 的 内 容 涉 及 内 核 启动 的 细节 , 你 可 以 跳 到 第 6 章 学 习 用 户 空间 启动 以 及 内 核 初始 
化 第 一 个 用 户 进程 等 内 容 。 


5.3 内核 参数 


运行 Tino 由 校 的 时 伯 : 引导 装载 程序 会 向 内 核 传递 一 系列 文本 形式 的 内 核 参 数 来 设 定 内 核 
的 启动 方式 。 这 些 参数 设 定 了 很 多 不 同 的 行为 方式 ， 比 如 内 核 显 示 的 诊断 信息 的 多 少 、 设 备 驱 动 
程序 相关 参数 等 。 
你 可 以 通过 /proc/cmdline 文 件 来 查看 系统 启动 时 使 用 的 内 核 参 数 : 


$ cat /proc/cmdline 
BOOT_IMAGE=/boot/vmlinuz-3.2.0-67-generic-pae root=UUID=70ccd6e7-6ae6-44f6- 
812c-51aab8036d29 ro quiet splash vt.handoff=7 


这 些 参数 有 的 是 一 个 单词 的 长 度 ， 诸 如 ro、quiet ， 有 的 是 key=value 这 样 的 配对 ( 例如 
vt.handoff=7 ), 它们 中 大 部 分 都 无 关 紧 要 , 如 splash 标 记 的 意思 是 显示 一 个 闪 屏 ( splash screen )。 
但 root 参 数 很 重要 ， 它 是 root 文 件 系统 存放 的 位 置 ， 如 果 没有 这 个 参数 ， 内 核 将 无 法 完成 初始 化 
工作 ， 从 而 也 就 无 法 启动 用 户 空间 。 

root 文 件 系统 参数 值 是 一 个 设备 文件 ， 例 如 : 


TY0oot=/dev/sdal1 


然而 现在 的 桌面 系统 中 经 常 使 用 UUID ( 见 4.2.4 市 ): 


root=UUID=70ccd6e7-6ae6-44f6-812c-51aab8036d29 


参数 ro 告诉 内 核 在 用 户 空间 启动 时 以 只 读 模 式 挂 载 root 文 件 系 统 。( 使 用 只 读 模 式 能 够 让 
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fsck 安 全 地 对 root 文 件 系 统 做 检查 ， 之 后 启动 进程 重新 以 可 读 写 模式 来 挂 载 root 文 件 系统 。) 

如 果 遇 到 无 法 识别 的 参数 ，Linux 内 核 会 将 其 保存 ， 稍 后 在 启动 用 户 空间 时 传递 给 init。 如 果 
你 加 入 参数 -s， 内 核 会 将 其 传递 给 init， 让 其 以 单 用 户 模式 启动 。 

下 面 我 们 介绍 引导 装载 程序 是 如 何 启动 内 核 的 。 


5.4 引导 装载 程序 


在 启动 过 程 的 最 开始 ， 引 导 装 载 程序 启动 内 核 ， 然 后 内 核 和 init 启 动 。 引 导 装 载 程序 的 工作 
看 似 很 简单 : 将 内 核 加 载 到 内 存 ， 然 后 使 用 一 系列 内 核 参 数 启动 内 核 。 但 是 关于 引导 装载 程序 ， 
需要 弄 清楚 下 面 两 个 问题 。 

口 内 核 在 哪里 ? 
口 内 核 启 动 时 需要 传递 哪些 参数 ? 

答案 是 : 内 核 及 其 参数 (通常 是 ) 在 root 文 件 系统 中 。 因 为 内 核 此 时 还 没有 开始 运行 ， 无 法 
遍历 文件 系统 , 所 以 内 核 参 数 需 要 被 放 到 一 个 容易 存 取 的 地 方 。 并 且 此 时 用 于 访问 磁盘 的 内 核 设 
备 驱 动 还 没有 准备 好 ， 这 听 起 来 有 点 像 “ 鸡 生 蛋 ， 和 蛋 生 鸡 ”。 

我 们 先 看 一 下 驱动 程序 。 在 个 人 电脑 上 ，3 引 导 装 载 程 序 使 用 基本 输入 输出 系统 ( 以 下 简称 
BIOS ) 或 者 统一 可 扩展 固件 接口 (Unified Extensible Firmware Interface， 以 下 简称 UEFI ) 来 访问 
人 磁盘。 几乎 所 有 的 磁盘 设备 都 有 固件 系统 供 BIOS 通 过 线性 块 寻 址 (Linear Block Addressing ) 来 
访问 硬件 。 虽 然 性 能 不 怎么 样 , 但 是 这 种 方式 可 以 访问 磁盘 的 任意 位 置 。 引 导 装 载 程序 往往 是 唯 
一 使 用 BIOS 访 问 磁盘 的 程序 。 内 核 使 用 的 是 它 自己 的 高 性 能 驱动 程序 。 

大 多 数 现 在 的 引导 装载 程序 都 能 够 读 取 分 区 表 , 内 建 以 只 读 模 式 访问 文件 系统 的 功能 ， 因此 
它们 能 够 查找 和 读 取 文件 。 这 使 得 动态 配置 和 完善 引导 装载 程序 变 得 非常 简单 。 并 不 是 所 有 的 
Linux 引 导 装 载 程序 都 有 这 些 功 能 ， 配 置 引 导 装 载 程序 因而 变 得 困难 得 多 。 


5.4.1 引导 装载 程序 任务 


Linux 引 导 装 载 程序 的 核心 功能 如 下 : 
口 从 多 个 内 核 中 选择 一 个 使 用 ; 
口 从 多 个 内 核 参数 集中 选择 一 个 使 用 ; 
口 允许 用 户 手动 更 改 内 核 映 像 名 和 参数 ( 例如 使 用 单 用 户 模式 ); 
口 支持 其 他 操作 系统 的 启动 。 

自 Linux 内 核 问 世 以 来 ， 引导 装 载 程序 的 功能 得 到 了 极 大 的 增强 ， 加 入 了 历史 记录 和 菜单 界 
面 , 不 过 最 基本 的 需求 仍然 是 能 够 灵活 选择 内 核 映 像 和 参数 。 有 趣 的 是 某 些 方面 的 需求 逐渐 消失 
了 。 例 如 , 现在 你 可 以 从 USB 设 备 上 执行 紧急 启动 和 恢复 ， 因 而 你 可 能 不 再 需要 手工 设置 内 核 参 
数 和 进入 单 用 户 模 式 。 不 过 因为 现在 引导 装载 程序 强大 的 功能 ,更改 内 核 参 数 、 创 建 定制 内 核 这 
些 事情 也 变 得 容易 得 多 。 
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5.4.2 引导 装载 程序 概述 


以 下 是 一 些 常 见 的 引导 装载 程序 ， 按 照 普及 的 顺序 排列 。 

口 GRUB: 近乎 于 Linux 系 统 标准 。 

口 LILO: 最 早期 的 Linux 引 导 装 载 程序 之 一 ， 是 UEFI 的 一 个 版 本 。 

口 SYSLINUX: 能 够 在 很 多 不 同 的 文件 系统 上 配置 和 启动 。 

口 LOADLIN: 能 够 从 MS-DOS 上 启动 内 核 。 

口 efilinux: UEFI 引 导 装 载 程序 的 一 种 ， 作 为 其 他 UEFI 引 导 装 载 程序 的 模块 和 引用 。 

口 coreboot ( 以 前 又 叫 作 LinuxBIOS ): PC BIOS 的 高 性 能 蔡 代 品 ， 并 且 能 够 包含 内 核 。 

D Linux Kernel EFISTUB: 能 够 从 EFI/UEFI 系 统 分 区 ( ESP ) 加 载 内 核 的 一 个 内 核 插件 。 5 

本 书 只 涉及 GRUB。 其 他 引导 装载 程序 也 有 某 些 优 于 GRUB 的 地 方 , 比如 更 容易 配置 或 更 快速 。 
要 设置 内 核 名 称 和 参数 ， 你 首先 需要 了 人 解 如 何 进入 启动 提示 符 。 因 为 很 多 Linux 系 统 定制 了 

引导 装载 程序 ， 使 得 我 们 有 时 很 难 找 到 进入 启动 提示 符 的 方法 。 下 一 节 我 们 会 介绍 如 何 进 入 启 

动 提示 符 来 设置 内 核 名 称 和 参数 ， 然 后 你 将 了 解 如 何 设置 和 安装 引导 装载 程序 。 


5.5 ” GRUB 简介 


GRUB 意 指 大 一 统 引 导 装 载 程序 (Grand Unified Boot Loader )。 本 节 我 们 将 介绍 GRUB 2。 
GRUB 有 一 个 较 老 的 版 本 叫 作 GRUB Legacy， 现 在 逐渐 被 淘汰 了 。 

GRUB 最 重要 的 一 个 功能 是 对 内 核 映 像 和 配置 的 选择 更 为 简便 。 
解 GRUB。GRUB 界 面 易 于 操作 ,不 过 Linux 的 发 行 版 尽 可 能 将 引导 装载 程序 隐藏 起 来 ， 你 可 
机 会 看 到 。 

你 可 以 在 BIOS 或 者 固件 启动 屏幕 出 现时 按 住 SHIFT 来 打开 GRUB 菜 单 。 图 $-1 中 是 GRUB 菜 
单 ， 可 以 按 ESC 来 暂时 取消 自动 启动 计时 。 


GNU BRUB version 1.93-21uUbuntu3.1 


Ubuntu，uwjith Linux 3.2.0-31-generic-pae 

Ubuntu, with Linux 3.2.0-31-generic-pae (recovery mode) 
Previous Linux versions 

Hemory test (memtesi86+) 

Memory test tmemtest86+, serial console 115200) 


Use the + and + keys to select which entry is highlighted. 
Press enter tn boot the selected 0S, 'e' to edit the commands 
before booting or 'c' for a command-line. 


图 5-1 GRUB 菜 单 
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可 以 通过 以 下 步骤 来 查看 引导 装载 程序 。 

(1) 打开 或 者 重启 Linux。 

(2) 在 BIOS/ 固 件 自 检 时 或 者 启动 屏幕 显示 时 ， 按 住 SHIFT 显 示 GRUB 菜 单 。 
(3) 按 E 键 查看 引导 装载 程序 命令 的 默认 启动 选项 ， 如 图 $-2 所 示 。 


BNU BRUB wersion 1.99-21ubuntu3.1 


setparams ‘Ubuntu, with Linux 3.2.0-31-eenePic-pae 


recordfail 

gft«xmode Slinux_efx_mode 

insmod gzio 

insmod part_msdos 

insmod exte 

set root=" (hdo,msdos1) 

search --no-f1loppy --fs-uuid --set=root 4838e145-bo6d-45bd-b7b4-7326", 
boo273b7 

1Linux :boot/vmlinyz-3.2.0-31-generic-pae root=UUID=4838e145-b064-45b", 
d-b7b4-7326bo0273b7 ro dquiet splash $vyt_handoft 

initrd boot/initrd. ime-3,.2.0-31-generic-pae 


Hinimum Emacs-like screen editing is supported, TAB lists 
completions, Press Ctrl-x or Flb to boot, Ctrl-c or Fe for 

a command-line or ESC to discard edits and return to the GRUB 
menu . 


图 $-2”GRUB 配 置 编 辑 器 


如 图 所 示 , root 文 件 系 统 被 设置 为 一 个 UUID, 内 核 映 像 是 /boot/vmlinuz- 3.2.0-31-generic- 
pae ， 内 核 参数 包括 ro 、quiet 和 splash 。 和 初始 RAM 文 件 系统 是 /boot/initrd.img-3.2.0- 
31-generic-pae。 如 果 你 从 来 没有 见 过 这 些 配 置信 息 ， 可 能 会 觉得 比较 糊涂 。 你 可 能 会 问 为 什么 
会 有 这 么 多 地 方 涉及 root? 它们 有 什么 区 别 ? 为 什么 这 里 会 出 现 insmod? Linux 内 核 不 是 通常 由 
udevd 运 行 吗 ? 

我 一 说 你 就 明白 了 ， 因 为 GRUB 仅 仅 是 启动 内 核 ， 而 不 是 使 用 它 。 你 看 到 的 这 些 配置 信息 都 
由 GRUB 的 内 部 命令 构成 ，GRUB 自 身 另 成 一 个 体系 。 

产生 混淆 的 原因 是 GRUB 借 用 了 很 多 其 他 地 方 的 术语 。GRUB 有 自己 的 “内 核 ” 和 insmod 命 
令 来 动态 加 载 GRUB 模 块 ,这 和 Linux 内 核 没 有 任何 关系 ,很 多 GRUB 命 令 和 Unix shell 命 令 很 类 似 ， 
GRUB 也 有 一 个 1s 命 令 来 显示 文件 列表 。 

不 过 最 让 人 糊涂 的 地 方 还 是 root 这 个 词 。 为 了 表达 得 更 清楚 ， 我 们 只 需要 遵循 一 个 简单 的 法 
则 ， 就 是 : 只 有 root 内核 参数 是 指 root 文 件 系统 。 

在 GRUB 配 置 中 , root 这 个 内 核 参 数 在 linux 命 令 中 的 映像 文件 名 后 面 。 其 他 配置 信息 中 出 现 
root 的 地 方 指 的 都 是 GRUB root, 它 只 针对 GRUB, 是 GRUB 查 找 内 核 和 RAM 文 件 系 统 映 像 时 使 用 
的 文件 系统 。 

在 图 5-2 中 ，GRUB root 一 开始 被 设置 为 GRUB 相 关 设 备 (hd0,msdosl )。 在 随后 的 命令 中 ， 
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GRUB 查 找 一 个 特定 分 区 的 UUID， 如 果 找 到 的 话 就 将 该 分 区 设置 为 GRUB root。 

总 而 言 之 ,1inux 命 令 的 第 一 个 参数 ( /boot/vmlinuz-... ) 是 Linux 内 核 映 像 文件 的 位 置 .GRUB 
从 GRUB root 上 加 载 此 文件 。 类 似 地 ，initrd 命 令 指定 初始 的 RAM 文 件 系 统 文件 。 

你 可 以 在 GRUB 内 配置 这 些 信息 ,通常 启动 错误 可 以 用 这 种 方式 来 暂时 性 地 修复 。 如 果 要 永 
久 性 地 修复 启动 问题 ， 你 需要 更 改 配 置信 息 ( 见 5.5.2 节 )， 不 过 目前 让 我 们 先 深 入 GRUB 内 部 ， 
看 看 其 命令 行 界面 。 


5.5.1 使 用 GRUB 命 令 行 浏览 设备 和 分 区 


如 图 5-2 所 示 ，GRUB 有 自己 的 设备 寻 址 方式 。 例 如 ， 系 统 检 测 到 的 第 一 个 硬盘 是 hd0， 然 后 
是 hdl1， 以 此 类 推 。 然 而 设备 分 配 会 有 变化 。 还 好 GRUB 能 够 在 所 有 的 分 区 中 通过 UUID 来 查找 得 
内 核 所 在 的 分 区 ， 就 像 你 刚才 在 search 命 令 中 看 到 的 那样 

设备 列表 

想 要 了 解 GRUB 如 何 显示 系统 中 的 设备 ， 可 以 在 启动 菜单 或 者 配置 编辑 器 中 按 C 键 进入 
GRUB 命 令 行 。 你 将 看 到 以 下 提示 符 : 


O 


grub> 


这 里 你 可 以 运行 任何 你 在 配置 信息 中 看 到 的 命令 。 我 们 可 以 从 1s 命 令 开始 , 不 带 参 数 , 命令 
的 输出 结果 是 GRUB 能 够 识别 的 所 有 设备 的 列表 : 


grub> ls 
(hdo) (hdo,msdos1) (hdo,msdos5) 


本 例 中 有 一 个 名 为 hd0 的 主 磁盘 设备 和 分 区 (hd0,msdosl ) 及 (hd0,msdos5 )。 前 缀 msdos 表 示 
磁盘 包含 MBR 分 区 表 。 如 果 包 含 的 是 GPT 分 区 表 ， 则 前 级 就 是 gpt。( 还 可 能 会 有 第 三 个 标识 符 来 
表示 更 多 可 能 的 组 合 ， 如 分 区 包含 BSD 磁 盘 标 签 映 射 ， 不 过 你 通常 不 需要 太 关 注 ， 除 非 你 在 一 台 
机 器 上 运行 多 个 操作 系统 。) 

使 用 1s -1 命令 可 以 查看 更 详细 的 信息 。 此 命令 能 显示 磁盘 上 所 有 分 区 的 UUID， 所 以 非常 有 
用 ， 例 如 : 


grub> ls -1 
Device hdo: Not a known filesystem - Total size 426743808 sectors 
Partition hdo,msdos1: Filesystem type ext2 - Last modification time 
2015-09-18 20:45:00 Friday, UUID 4898e145-b064-45bd-b7b4-7326b00273b7 - 
Partition start at 2048 - Total size 424644608 sectors 
Partition hdo,msdos5: Not a known filesystem - Partition start at 
424648704 - Total size 2093056 sectors 


如 上 所 示 , 磁盘 在 第 一 个 MBR 分 区 上 有 一 个 Linux ext2/3/4 文 件 系统 , 在 分 区 5 上 有 一 个 Linux 
交换 区 签名 ,这样 的 配置 很 常见 。( 从 输出 中 可 以 看 到 (hd0,msdos5) 是 交换 分 区 。) 
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文件 导航 
现在 我 们 来 看 看 GRUB 的 文件 系统 导航 。 你 可 以 使 用 echo 命 令 来 查看 GRUB root 文 件 系统 (这 
是 GRUB 寻 找 内 核 的 地 方 ): 


grub> echo $root 
hdo ,msdos1 


可 以 在 GRUB 的 1s 命 令 中 的 分 区 后 面 加 上 /来 显示 root 文 件 系统 下 的 文件 和 目录 : 


grub> ls (hdo,msdos1)/ 


不 过 要 记 住 键入 分 区 名 是 件 麻 烦 事 ,为 了 节省 时 间 ， 你 可 以 使 用 root 变 量 : 


grub> ls ($root)/ 


输出 结果 是 该 分 区 上 的 文件 系统 中 的 目录 和 文件 名 列表 ， 诸 如 etc/、bin/ 和 dev/。 你 需要 了 解 
的 是 ,这 个 命令 和 GRUB 1s 的 功能 完全 不 同 ， 后 者 列 出 设备 、 分 区 表 盒 文件 系统 头 信息 ， 而 这 个 
命令 显示 的 是 文件 系统 的 内 容 。 

使 用 类 似 的 方法 ， 你 可 以 进一步 查看 分 区 上 的 文件 和 目录 的 内 容 。 例 如 ， 如 果 要 查看 boot 目 
录 的 内 容 ， 可 以 使 用 : 


grub> ls ($root)/boot 


注解 ”你 可 以 使 用 上 下 键 来 查看 命令 历史 记录 ,使 用 左右 键 来 编辑 当前 命令 行 。 也 可 以 使 用 标 
准 行 命令 如 : CTRL-N、CTRL-P 等 。 


你 也 可 以 使 用 set 命 令 查看 所 有 已 经 设置 的 GRUB 变 量 : 


grub> set 

?=0 

color highlight=black/white 
color normal=white/black 

-- Snip-- 
prefix=(hdo,msdos1)/boot/grub 
TOot=hdo ,msdos1 


这 些 变量 当中 , $prefix 是 很 重要 的 一 个 , GRUB 使 用 它 指定 的 文件 系统 和 目录 来 寻找 配置 和 
辅助 支持 信息 。 我 们 将 在 下 一 节 详 细 介 绍 。 

使 用 GRUB 命 令 行 界面 完成 工作 后 ,你 可 以 键入 boot 命 令 来 启动 系统 ， 或 者 按 ESC 键 回 到 
GRUB 菜 单 来 启动 系统 。 整 个 系统 启动 完毕 准备 就 绪 之 后 ， 让 我 们 来 看 看 GRUB 配 置信 息 。 


图 灵 社 区 会 员 小 虎 (164142021@qq.com) 专 享 尊重 版 权 


5.5 _ GRUB 简介 83 


5.5.2 ” GRUB 配置 信息 


GRUB 配 置 目 录 包 含 核心 配置 文件 ( grub.cfg ) 和 一 些 可 加 载 模块 ， 以 .mod 为 后 级 。( 随 着 
GRUB 版 本 的 演进 ， 这 些 模块 被 逐渐 移 到 像 386-pc 这 样 的 子 目录 中 。) 配置 目录 通常 是 /boot/grub 
或 者 /boot/grub2。 我 们 不 直接 编辑 grub.cfg 文 件 ， 而 是 使 用 grub-mkconfig 命 令 (或 者 Fedora 上 的 
grub2-mkconfig )。 

回顾 grub.cfg 

首先 我 们 看 一 下 GRUB 是 如 何 通过 grub.cfg 文 件 来 初始 化 菜单 和 内 核 选 项 的 。 你 会 看 到 
grub.cfg 文 件 中 包含 GRUB 命 令 ， 通 常 是 从 一 系列 的 初始 化 步 又 开始 ， 然 后 是 一 系列 的 菜单 条 目 ， 
针对 不 同 的 内 核 和 启动 配置 。 初 始 化 过 程 并 不 复杂 ， 它 就 是 一 系列 的 函数 定义 和 视频 设置 命令 ， 
如 下 所 示 : 


if loadfont /usr/share/grub/unicode.pf2 ; then 
set gfxmode=auto 
load video 
insmod gfxterm 
-- SNnip-- 


稍 后 在 文件 中 你 还 会 看 到 启动 配置 信息 ， 它 们 以 menuentry 命 令 开始 。 通 过 上 市 的 介绍 ， 你 
应 该 能 够 理解 以 下 这 些 内 容 : 


menuentry 'Ubuntu, with Linux 3.2.0-34-generic-pae' --class ubuntu -- class gnu-linux --class gnu 
--class os { 

recordfail 

gfxmode $linux gfx_mode 

insmod gzio 

insmod part msdos 

insmod ext2 

set root="' (hd0,msdos1)" 

search --no-floppy --fs-uuid --set=root 70ccd6e7-6ae6-44f6-812c-51aab8036d29 

linux /boot/vmlinuz-3.2.0-34-generic-pae root=UUID=70ccd6e7-6ae6-44f6-812c-51aab8036d29 

ro quiet splash $vt handoff 
initrd /boot/initrd.img-3.2.0-34-generic-pae 


请 留意 submenu 命 令 。 如 果 你 的 grub.cfg 文 件 包含 一 系列 menuentry 命 令 , 它们 中 大 多 数 可 能 和 
包含 在 submenu 命 令 中 ， 这 是 针对 较 老 版 本 的 内 核 设计 的 ， 以 免 GRUB 菜 单 过 于 腔 肿 。 

生成 新 的 配置 文件 

如 果 想 要 更 改 GRUB 配 置 , 我 们 不 会 直接 编辑 grub.cfg 文 件 , 因为 它 是 由 系统 自动 生成 和 更 新 
的 。 你 可 以 将 新 的 配置 信息 放 到 其 他 地 方 ， 然 后 运行 grub-mkconfig 来 生成 新 的 配置 文件 。 

在 grub.cfg 文 件 的 最 开头 应 该 有 一 行 注释 ， 如 下 : 


### BEGIN /etc/grub.d/00_header ### 
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你 会 发 现 ，/etc/grub.d 中 的 文件 都 是 shell 脚 本 ， 它 们 各 自生 成 grub.cfg 文 件 的 某 个 部 分 。 
grub-mkconfig 命 令 本 身 也 是 一 个 shell 脚 本 文件 ， 负 责 运 行 /etc/grub.d 中 的 所 有 脚本 文件 。 

你 可 以 使 用 root 账 号 来 自己 试 一 试 。( 不 用 担心 当前 的 配置 信息 会 被 覆盖 , 该 命令 只 会 将 配置 
信息 输出 到 标准 输出 ， 即 屏幕 。) 


# grub-mkconfig 


如 果 你 想 要 在 GRUB 配 置 中 加 入 新 的 菜单 条 目 和 其 他 命令 ， 简 单 来 说 ， 可 以 在 GRUB 配 置 目 
录 中 创建 一 个 新 的 .cfg 文 件 来 存放 你 的 内 容 ， 如 /boot/grub/custom.cfg。 

如 果 涉 及 细节 就 会 复杂 一 些 了 。 /etclgrub.d 配 置 目录 为 你 提供 了 两 个 选项 : 40_custom 和 和 41_custom。 
前 者 是 一 个 脚本 文件 , 你 可 以 编辑 , 但 是 系统 升级 有 可 能 会 将 你 的 更 改 清 除 掉 ， 所 以 这 个 选项 不 
太保 险 。41_custom 脚 本 更 简单 一 些 ， 它 是 一 组 命令 ， 用 来 在 GRUB 启 动 的 时 候 加 载 custom.cfg 文 
件 。( 请 注意 ， 如 果 使 用 该 方法 ， 你 的 配置 更 改 只 有 在 配置 文件 生成 后 才 会 起 作用 。) 

它们 并 不 是 唯一 定制 配置 的 方法 。 在 一 些 Linux 发 行 版 中 ,你 有 可 能 在 /etc/grub.d 目 录 中 看 到 
其 他 的 选项 。 例 如 : Ubuntu 在 配置 中 加 入 了 内 存 测试 启动 选项 memtest86+。 

你 可 以 使 用 grub-mkconfig 命 令 加 -o 选 项 将 新 生成 的 文件 写 到 GRUB 目 录 ， 如 下 所 示 : 


# grub-mkconfig -o /boot/grub/grub.cfg 


如 果 你 使 用 的 是 Ubuntu， 可 以 使 用 install-grub。 在 进行 这 类 操作 的 时 候 ， 请 注意 将 旧 的 配 
置 文件 进行 备份 ， 以 及 确保 目录 路 径 正确 。 

现在 让 我 们 看 看 更 多 关于 GRUB 和 引导 装载 程序 的 技术 细节 ， 如 果 你 觉得 已 经 了 解 得 足够 
多 ,可 以 直接 跳 到 第 6 章 。 


5.5.3 ”安装 GRUB 


通常 你 不 用 太 关注 GRUB 的 安装 , Linux 系 统 会 自行 完成 。 不 过 如 果 你 想 复 制 或 恢复 可 启动 磁 
盘 ， 或 者 自 定义 启动 顺序 ， 可 能 就 需要 自己 安装 GRUB。 

在 继续 以 下 内 容 之 前 ， 你 可 以 先 阅读 5.8.3 节 了 人 解 系统 如 何 启动 ， 并 在 MBR 和 EFI 之 间 做 出 选 
择 。 接 着 ， 你 将 编译 GRUB 可 执行 代码 集 ， 并 且 决 定 GRUB 目 录 的 位 置 ( 默认 是 /boot/grub )。 如 
果 Linux 系 统 已 经 提供 了 GRUB 软 件 包 , 你 就 不 必 自 己 动手 , 否则 可 以 参考 第 16 章 来 学 习 如 何 从 源 
码 编译 可 执行 代码 ,你 需要 确保 目标 正确 无 误 。 这 和 MBR 以 及 UEFI 启 动 不 同 (32 位 EFI 和 64 位 EFI 
也 不 同 )。 

在 系统 上 安装 GRUB 

安装 引导 装载 程序 需要 你 或 者 安装 程序 决定 以 下 几 方 面 。 
口 你 的 运行 系统 的 目标 GRUB 目 录 。 通 常 是 /boot/grub， 不 过 如 果 你 在 不 同 的 系统 和 磁盘 上 
安装 的 话 ， 目 录 位 置 可 能 会 不 一 样 。 
口 GRUB 目 标 磁 盘 对 应 的 设备 。 
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口 UEFI 启 动 分 区 的 挂 载 点 ， 如 果 是 UEFI 启 动 的 话 。 

请 注意 ，GRUB 是 一 个 模块 化 系统 ， 但 为 了 加 载 模块 ， 它 必须 要 能 够 读 取 GRUB 目 录 所 在 的 
文件 系统 。 你 的 任务 就 是 构建 一 个 GRUB 系 统 ， 它 能 够 读 取 文件 系统 ， 加 载 配 置 文件 ( grub.cfg ) 
以 及 其 他 需要 的 模块 。 在 Linux 上 ,这 通常 指 的 是 使 用 预 加 载 的 ext2.mod 模 块 来 编译 一 个 GRUB 系 
统 。 编 译 完成 后 ， 你 需要 将 其 放 到 磁盘 上 的 可 启动 区 域 ,将 其 他 需要 用 到 的 文件 放 到 /book/grub 
目录 中 。 

所 笠 的 是 ，GRUB 自 带 一 个 叫 作 grub-instal1 的 工具 (注意 不 要 和 Ubuntu 的 instal1-grub 混 
消 )， 它 负责 大 部 分 的 GRUB 文 件 安装 和 配置 工作 。 例 如 ， 如 果 你 想 在 /devsda 上 安装 GRUB 目 录 
/boot/grub， 可 以 使 用 以 下 命令 (在 MBR 上 ): 


# grub-install /dev/sda 


警告 GRUB 安 装 不 正确 可 能 会 让 系统 的 启动 顺序 失效 ， 所 以 请 小 心 操 作 。 最 好 是 了 解 一 下 如 
何 使 用 dd 来 备份 MBR ， 并 且 备 份 其 他 已 经 安装 了 的 GRUB 目 录 ， 最 后 确保 你 有 一 个 应 急 
启动 计划 。 


在 外 部 存储 设备 上 安装 GRUB 

在 当前 系统 之 外 安装 GRUB ， 你 必须 在 目标 设备 上 手动 指定 GRUB 目 录 。 例 如 ， 你 的 目标 设 
备 是 /devwsdc， 其 root 启 动 文 件 系统 (rootboot ) 挂 载 到 系统 中 的 /mnt。 这 表示 当 你 安装 GRUB 时 ， 
你 的 系统 将 会 在 /mnt/boot/grub 中 找到 GRUB 文 件 。 你 需要 在 运行 grub-install 时 指定 那些 文件 的 
位 置 : 


# grub-install --boot-directory=/mnt/boot /dev/sdc 


使 用 UEFI 安 装 GRUB 

使 用 UEFI 安 装 应 该 要 简单 些 。 你 需要 做 的 就 是 将 引导 装载 程序 拷贝 到 指定 的 地 方 。 但 是 你 
还 需要 使 用 efibootmgr 命 令 向 固件 注册 引导 装载 程序 。grub-instal1 命 令 会 运行 这 个 命令 ， 如 果 
它 存在 的 话 。 理 论 上 说 你 要 做 的 就 是 : 


# grub-install --efi-directory=efi dir --bootloader-id=name 


这 里 的 efi_dir 是 UEFI 目 录 在 你 的 系统 中 的 位 置 (通常 是 /boot/efi/efi， 因 为 UEFI 分 区 通常 是 
挂 载 到 /boot/efi 上 )。name 是 引导 装载 程序 的 标识 符 ， 我 们 将 在 5.8.2 节 介绍 。 

遗憾 的 是 ， 在 安装 UEFI 引 导 装 载 程序 时 会 出 现 很 多 问题 。 举 个 例子 ， 如 果 你 在 为 男 一 个 系 
统 安装 磁盘 ,你 需要 知道 如 何 向 系统 的 固件 注册 引导 装载 程序 。 此 外 ， 可 移动 媒体 的 安装 程序 也 
不 尽 相同 。 

不 过 最 大 的 问题 还 是 在 于 UEFI 安 全 启动 。 
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5.6 ”UEFI 安全 启动 的 问题 


最 新 出 现 的 Linux 安 装 问题 之 一 是 安全 启动 。 这 个 特性 在 UEFI 中 打开 时 ， 需 要 引导 装载 程序 
被 一 个 信任 的 机 构 进行 电子 签名 。 微 软 要 求 Windows 8 供应 商 使 用 安全 启动 。 如 果 你 安装 了 一 个 
没有 被 签名 的 引导 装载 程序 ( 目前 大 多 数 Linux 系 统 是 这 样 )， 它 将 无 法 启动 。 

如 果 你 对 Windows 不 感 兴 趣 ， 可 以 在 EFI 设 置 中 关闭 安全 启动 。 然 而 对 于 双 系 统计 算 机 来 说 
这 可 能 不 是 一 个 好 选择 。 因 此 Linux 系 统 提供 了 经 过 签名 的 引导 装载 程序 。 一 些 解决 方案 只 不 过 
是 GRUB 的 一 个 包装 ， 一 些 则 提供 完全 的 、 经 过 签名 的 加 载 过程 〈《 从 引导 装载 程序 一 直到 内 核 )， 
还 有 一 些 则 是 全 新 的 引导 装载 程序 ( 有 一 些 是 基于 efilinux )。 


5.7 ” 链 式 加 载 其 他 操作 系统 


UEFI 使 得 加 载 其 他 操作 系统 相对 容易 ， 因 为 你 可 以 在 EFI 分 区 上 安装 多 个 引导 装载 程序 。 
然而 ， 较 老 的 MBR 不 支持 这 个 功能 ，UEFI 也 不 支持 ， 你 还 是 需要 一 个 单独 的 分 区 以 及 MBR 引 
导 装 载 程序 。 你 可 以 使 用 链 式 加 载 (chainload ) 来 让 GRUB 加 载 和 运行 指定 分 区 上 的 不 同 引导 
装载 程序 。 

要 想 使 用 链 式 加 载 ， 你 需要 在 GRUB 配 置 中 新 建 一 个 菜单 条 目 ( 使 用 5.5.2 节 介绍 的 方法 )。 
下 面 是 一 个 在 磁盘 的 第 三 个 分 区 上 启动 Windows 的 例子 。 


menuentry "Windows" { 
insmod chain 
insmod ntfs 
set root=(hdo,3) 
chainloader +1 


选项 +1 告 诉 chainloader 加 载 分 区 上 的 第 一 个 扇 区 中 的 内 容 。 你 还 可 以 使 用 下 面 的 例子 加 载 
io.sys MS-DOS 加 载 程序 : 


menuentry "DOS" { 
insmod chain 
insmod fat 
set root=(hdo,3) 
chainloader /io.sys 


5.8 引导 装载 程序 细节 


现在 让 我 们 来 看 一 看 引导 装载 程序 的 细节 。 如 果 你 对 此 没有 兴趣 ， 可 以 跳 到 下 一 章 。 
要 理解 像 GRUB 这 样 的 引导 装载 程序 的 工作 原理 ,首先 需要 看 看 你 打开 计算 机 时 都 发 生 了 什 
么 事情 。 传 统计 算 机 启动 机 制 纷繁 复杂 ， 有 两 个 主要 机 制 : MBR 和 UEFI。 
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5.8.1 MBR 启 动 


除了 我 们 在 4.1 节 中 介绍 的 分 区 信息 之 外 ,， 主 引导 记录 ( Master Boot Record, 以 下 简称 MBR ) 
还 有 一 个 441 字 节 大 小 的 区 域 ，BIOS 在 开机 自 检 ( Power-On Self-Test， 以 下 简称 POST ) 之 后 加 载 
其 中 的 内 容 。 然 而 因为 空间 太 小 ,无 法 容纳 引导 装载 程序 ,所 以 需要 额外 的 空间 ， 从 而 就 引入 了 
多 场景 引导 装载 程序 ( multi-stage boot loader )。 一 开始 MBR 加 载 引导 装载 程序 的 其 余部 分 通常 
是 在 MBR 和 第 一 个 分 区 之 间 。 

当然 , 这样 做 并 不 安全 ， 因 为 里 面 的 代码 任何 人 都 可 以 修改 , 不 过 大 部 分 的 引导 装载 程序 使 
用 的 是 这 个 方式 , 包括 大 部 分 GRUB。 另外, 这 个 方式 对 于 GPT 分 区 的 磁盘 使 用 BIOS 启 动 不 适 用 ， 
因为 GP 表 信息 存放 在 MBR 之 后 的 区 域 。( 为 了 向 后 兼容 ，GPT 和 传统 的 MBR 分 开 存储 。) 

GPT 的 一 种 临时 解决 方案 是 创建 一 个 小 分 区 ， 称 为 BIOS 启 动 分 区 ， 即 使 用 一 个 特别 的 UUID 
作为 存放 完整 启动 加 载 代码 的 地 方 。 但 是 GPT 通 常 和 UEFI 一 起 使 用 ， 而 不 是 BIOS， 由 此 引出 了 
UEFI 启 动 方式 。 


5.8.2 UEFI 启 动 


计算 机 制造 商 和 软件 公司 意识 到 传统 的 BIOS 有 很 多 限制 ， 所 以 他 们 决定 开发 一 个 替代 品 ， 
这 就 是 可 扩展 固件 接口 (Extensible Firmware Interface， 以 下 简称 EFI )。EFI 的 普及 花 了 一 些 时 间 ， 
但 现在 应 用 很 普遍 。 目 前 的 标准 是 统一 可 扩展 国 件 接口 (Unified EFI， 以 下 简称 UEFI )， 包 括 了 
诸如 内 置 命令 行 界面 . 读 取 分 区 表 和 浏览 文件 系统 等 特性 .GPT 分 区 方式 也 是 UEFI 标 准 的 一 部 分 。 

UEFI 系 统 的 启动 过 程 非 常 不 同 ， 但 大 部 分 都 很 容易 理解 。 它 不 是 使 用 存放 在 文件 系统 之 外 
的 可 执行 启动 代码 ， 而 是 使 用 一 种 特殊 的 文件 系统 叫 作 EFI 系 统 分 区 (EFI System Partition， 以 下 
简称 ESP )， 其 中 包含 一 个 名 为 efi 的 目录 。 每 个 引导 装载 程序 有 自己 的 标识 符 和 一 个 对 应 的 子 目 
录 ， 如 efi/microsoft、efi/apple 或 efi/grub。 启 动 加 载 文 件 后 级 为 .ef ， 和 其 他 支持 文件 一 起 存放 在 这 
些 目录 中 。 


注解 “ESP 和 BIOS 启 动 分 区 不 同 ，5.8.1 节 中 有 介绍 ， 它 的 UUID 也 不 同 。 


还 有 一 点 需要 注意 ， 你 不 能 将 老 的 引导 装载 程序 代码 放 到 ESP 中 ， 因 为 这 些 代码 是 为 BIOS 
接口 写 的 。 你 必须 提供 为 UEFI 编 写 的 引导 装载 程序 代码 。 例 如 , 在 使 用 GRUB 的 时 候 ， 你 必须 安 
装 UEFI 版 本 的 GRUB ， 而 非 BIOS 版 本 的 。 另 外 ， 你 必须 向 固件 注册 (声明 ) 新 的 引导 装载 程序 。 

此 外 ， 如 5.6 节 中 介绍 的 那样 ， 我 们 还 会 面临 一 些 安 全 启动 方面 的 问题 。 


5.8.3 GRUB 工 作 原 理 


让 我 们 来 总 结 一 下 GRUB ， 看 看 它 是 如 何 工作 的 。 
(1) BIOS 或 者 固件 初始 化 硬件 ， 在 启动 存储 设备 上 寻找 启动 代码 。 
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(2) BIOS 和 固件 运行 找到 的 启动 代码 ， 开 始 GRUB。 

(3) 加 载 GRUB 核 心 。 

(4) 初始 化 GRUB 核 心 ， 此 时 GRUB 可 以 读 取 磁盘 和 文件 系统 。 

(5) GRUB 识 别 启动 分 区 ， 在 那里 加 载 配 置信 息 。 

(6) GRUB 为 用 户 提供 一 个 更 改 配 置 的 机 会 。 

(7) 超时 或 者 用 户 完成 操作 以 后 ，GRUB 执 行 配置 ( 执行 顺序 在 5.5.2 节 有 介绍 )。 

(8) 执行 过 程 当 中 ，GRUB 可 能 会 在 启动 分 区 中 加 载 额 外 的 代码 ( 模块 )。 

(9) GRUB 执 行 boot 命 令 ， 以 加 载 和 执行 配置 信息 中 1inux 命 令 指 定 的 内 核 。 

由 于 计算 机 系统 启动 机 制 各 异 ， 步骤 3 和 步骤 4 会 非常 复杂 。 最 常见 的 问题 是 “GRUB 核 心 在 
哪里 ? ”， 对 这 个 问题 有 三 个 可 能 的 答案 。 
口 部 分 存储 在 MBR 和 第 一 个 分 区 起 始 之 间 的 位 置 。 
口 存储 在 一 个 常规 分 区 上 。 
口 存储 在 一 个 特殊 启动 分 区 上 ， 如 GPT 启 动 分 区 、ESP 或 者 其 他 地 方 。 

除非 你 有 一 个 ESP， 一 般 情况 下 BIOS 会 从 MBR 加 载 512 字 节 ， 这 也 是 GRUB 起 始 的 地 方 。 这 
一 小 块 信息 ( 从 GRUB 目 录 中 的 boot.img 演 化 而 来 ) 还 不 是 核心 内 容 ， 但 是 它 包含 核心 信息 的 起 
始 位 置 ， 从 此 处 加 载 核 心 。 

如 果 你 有 ESP，GRUB 核 心 则 是 一 个 文件 。 固件 可 以 让 ESP 找 到 并 且 直 接 执行 GRUB 核 心 , 或 
者 是 其 他 操作 系统 的 引导 装载 程序 。 

对 大 多 数 系统 来 说 ， 上 面 的 内 容 只 是 管 中 宪 豹 。 在 加 载 和 运行 内 核 之 前 ,引导 装载 程序 或 许 
还 需要 加 载 一 个 初始 的 RAM 文 件 系统 映像 文件 到 内 容 。 相 关内 容 请 看 6.8 节 中 的 initrd 配 置 参数 。 
不 过 在 此 之 前 让 我 们 先 了 解 下 一 章 的 内 容 : 用 户 空间 启动 。 
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用 户 空 间 的 局 动 


内 核 启 动 第 一 个 用 户 空 间 进程 是 由 init 开 始 的 。 这 个 点 
很 关键 ， ee 对 准备 就 绪 ， 而 且 你 
还 能 看 到 系统 的 其 余部 分 是 怎样 启动 运行 的 。 在 此 之 前 ， 内 
核 执 行 的 是 受到 严格 控制 0 由 一 小 撮 程 序 员 开发 
和 定义 。 而 用 户 空 间 更 加 模块 化 ,我 们 容易 观察 到 其 中 进程 
的 启动 和 运行 过 程 。 对 于 好 奇 心 强 的 用 户 来 说 ， 用 户 空 间 的 启动 也 更 容易 修改 ， 
不 需要 底层 编程 知识 即 可 做 到 。 


户 空间 大 致 按 下 面 的 顺序 启动 : 
(1) init; 
(2) 基础 的 底层 服务 ， 如 udevd 和 syslogd; 
(3) 网 络 配 置 ; 
(4) 中 高 层 服务 ， 如 cron 和 打印 服务 等 ; 
(5) 登录 提示 符 、GUI 及 其 他 应 用 程序 。 


6.1 init 介绍 


init 是 Linux 上 的 一 个 用 户 空间 程序 。 和 其 他 系统 程序 一 样 ， 你 可 以 在 /sbin 目 录 下 找到 它 。 它 
主要 负责 启动 和 终止 系统 中 的 基础 服务 进程 ， 但 其 较 新 的 版 本 功能 更 多 一 些 。 

Linux 系 统 中 ，init 有 以 下 三 种 主要 的 实现 版 本 。 
口 System V init: 传统 的 顺序 init ( SysV， 读 作 “sys-five”)， 为 Red Hat Enterprise Linux 和 其 
他 的 Linux 发 行 版 使 用 。 
口 systemd: 新 出 现 的 init。 很 多 Linux 发 行 版 已 经 或 者 正在 计划 转向 systemd。 
口 Upstart: Ubuntu 上 的 init。 不 过 在 本 书 编写 时 ，Ubuntu 也 已 经 计划 转向 systemd。 
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还 有 一 些 其 他 版 本 的 init， 特别 是 在 般 入 式 系统 中 。 例 如 ，Android 就 有 它 自 己 的 init。BSD 系 
统 也 有 它们 自己 的 init, 不 过 在 目前 的 Linux 系 统 中 很 少见 到 了 ( 一 些 Linux 发 行 版 通过 修改 System 
V init 配 置 来 遵循 BSD 样 式 )。 

init 有 很 多 不 同 版 本 的 实现 ， 因 为 System V init 和 其 他 老 版 本 的 程序 依赖 于 一 个 特定 的 启动 顺 
序 , 每 次 只 能 执行 一 个 启动 任务 。 这 种 方式 中 的 依赖 关系 很 简单 ， 然 而 性 能 却 不 怎么 好 ， 因 为 启 
动 任务 无 法 并 行 。 另 一 个 限制 是 你 只 能 执行 启动 顺序 规定 的 一 系列 服务 。 如果 你 安装 了 新 的 硬件 ， 
或 者 需要 启动 一 个 新 的 服务 ， 该 版 本 的 init 并 不 提供 一 个 标准 的 方法 。systemd 和 Upstart 试 图 解决 
性 能 方面 的 问题 ， 为 了 加 快 启动 速度 ， 它 们 允许 很 多 服务 并 行 启动 。 它 们 各 自 的 实现 差异 很 大 。 
口 systemd 是 面向 目标 的 。 你 定义 一 个 你 要 实现 的 目标 以 及 它 的 依赖 条 件 ，systemd 负 责 满 足 
所 有 依赖 条 件 以 及 执行 目标 。systemd 还 可 以 将 该 目标 推迟 到 确实 有 必要 的 时 候 再 启动 。 
口 Upstart 则 完全 不 同 。 它 能 够 接收 消息 ， 根 据 接收 到 的 消息 来 运行 任务 ， 并 且 产 生 更 多 消 

息 ， 然 后 运行 更 多 任务 ， 以 此 类 推 。 

systemd 和 Upstart init 系 统 还 为 启动 和 跟踪 服务 提供 了 更 高 级 的 功能 。 在 传统 的 init 系 统 中 , 服 
务 守 护 进 程 是 通过 脚本 文件 来 启动 。 一 个 脚本 文件 负责 启动 一 个 守护 程序 , 守护 程序 脱离 脚本 自 
己 运行 。 你 需要 使 用 ps 命令 或 其 他 定制 方法 来 获得 守护 程序 的 PID。Upstart 和 和 systemd 则 与 此 不 同 ， 
它们 可 以 从 一 开始 就 将 守护 程序 纳入 管理 ， 提 供 正 在 运行 程序 的 更 多 信息 和 权限 。 

为 新 的 init 系 统 不 是 基于 脚本 文件 ， 所 以 配置 起 来 也 相对 简单 。System V init 脚 本 包含 很 多 
相似 的 命令 来 启动 、 停 止 和 重启 服务 ， 而 在 systetmd 和 Upstart 中 没有 这 人 么 多 宛 余 ， 这 让 你 更 加 专 
注 于 服务 本 身 ， 而 非 脚 本 命令 。 

最 后 ，systemd 和 Upstart 都 提供 一 定 程度 的 即时 服务 ， 而 不 是 像 System V init 那 样 在 启动 时 开 
启 所 有 需要 的 服务 。 它 们 根据 实际 需要 开启 相应 的 服务 。 这 并 不 是 什么 新 概念 ,传统 的 inetd 守 护 
程序 就 有 ， 只 不 过 新 的 实现 更 为 完善 。 

systemd 和 Upstart 都 对 System V 提 供 了 向 后 兼容 ， 如 支持 运行 级 别 ( runlevel ) 的 概念 。 


6.2 ”System V 运行 级 别 


在 Linux 系 统 中 ， 有 一 组 进程 自始至终 都 在 运行 ( 如 crond 和 udevd )。System V init 中 把 这 个 状 
态 叫 作 系统 的 运行 级 别 ， 使 用 数字 0~6 来 表示 。 系 统 几 乎 全 程 运行 在 单个 运行 级 别 中 ,但 是 当 你 
关闭 系统 的 时 候 ，init 就 会 切换 到 男 一 个 运行 级 别 ， 有 序 地 终止 系统 服务 ， 并 且 通 知 内 核 停止 。 

你 可 以 使 用 who -rt 命令 来 查看 系统 的 运行 级 别 。 运 行 Upstart 的 系统 会 返回 下 面 的 结果 : 


$ who -r 
run-level 2 2015-09-06 08:37 


结果 显示 系统 的 当前 运行 级 别 是 2， 还 有 运行 级 别 起 始 的 时 间 和 日 期 。 
运行 级 别 有 几 个 作用 , 最 主要 的 是 区 分 系统 的 启动 、 关 闭 、 单 用 户 模式 和 控制 台 模式 等 这 些 
不 同 的 状态 。 例 如 , Fedora 系 统一 般 使 用 2~4 来 表示 文本 控制 台 , 5 表示 系统 将 启动 图 形 登 录 界 面 。 
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但 是 运行 级 别 正在 逐渐 成 为 历史 。 虽 然 本 书 涉及 的 三 个 init 版 本 都 支持 它 , 但 systemd 和 Upstart 
将 其 视 为 已 经 过 时 的 特性 。 对 它们 来 说 ,保留 运行 级 别 只 是 为 了 启动 那些 只 支持 System V init 脚 
本 的 服务 ， 它 们 的 实现 也 有 很 大 不 同 ， 即 便 你 熟悉 其 中 一 个 ， 也 未 必 能 够 顺势 了 解 为 一 个 。 


6.3 识别 你 的 init 


在 我 们 继续 之 前 , 你 需要 确定 你 系统 中 的 init 版 本 。 如 果 你 不 确定 , 可 以 使 用 下 面 的 方法 查看 。 

口 如 果 系 统 中 有 目录 /usr/lib/systemd 和 /etc/systemd， 说 明 你 有 systemd， 可 以 直接 跳 到 6.4 节 。 

口 如 果 系 统 中 有 目录 /etc/init， 其 中 包含 .conf 文 件 ， 说明 你 的 系统 很 可 能 是 Upstart( 除非 你 

的 系统 是 Debian 7， 那 说 明 你 使 用 的 是 System V init )， 可 以 直接 跳 到 6.5 节 。 

口 如 果 以 上 都 不 是 ， 且 你 的 系统 有 /etc/inittab 文 件 ， 说 明 你 可 能 使 用 的 是 System V init， 可 以 
跳 到 6.6 节 。 

如 果 你 的 系统 安装 了 帮助 手册 ， 你 可 以 查看 init(0) 帮 助手 册 部 分 来 确认 你 的 init 版 本 。 


6.4 Systemd 


systemd init 是 Linux 上 新 出 现 的 init 实 现 之 一 。 除 了 负责 常规 的 启动 过 程 ，systemd 还 包含 了 一 
系列 的 Unix 标 准 服务 ， 如 cron 和 inetd。 它 借鉴 了 Apple 公 司 的 启动 程序 。 这 个 init 的 一 个 重要 特性 
是 : 它 可 以 延迟 一 些 服务 和 操作 系统 功能 的 开启 ， 直 到 需要 它们 时 再 开启 。 

systemd 的 特性 很 多 ， 学 习 起 来 可 能 会 没有 头绪 。 下 面 我 们 列 出 systemd 启 动 时 的 运行 步骤 : 

(1) systemd 加 载 配置 信息 ; 

(2) systemd 判 定 启动 目标 ， 通 常 是 default.target; 

(3) systemd 判 定 启动 目标 的 所 有 依赖 关系 ; 

(4) systemd 激 活 依赖 的 组 件 并 启动 目标 ; 

(5) 启动 之 后 ，systemd 开 始 啊 应 系统 消息 〈 诸 如 uevent )， 并 且 激 活 其 他 组 件 。 

systemd 并 没有 一 个 严格 的 顺序 来 启动 服务 。 和 现在 很 多 的 init 系 统一 样 ，systemd 启 动 的 顺序 
很 灵活 ， 大 部 分 的 systemd 配 置 尽量 避免 需要 严格 按 顺序 启动 ， 而 是 使 用 其 他 方法 来 解决 强 依 赖 
性 问题 。 


6.4.1 单元 和 单元 类 型 


systemd 最 有 特色 的 地 方 是 它 不 仅仅 负责 处 理 进 程 和 服务 ， 还 可 以 挂 载 文件 系统 、 监 控 网 络 
套 接 字 和 运行 时 系统 等 。 这 些 功 能 我 们 称 之 为 单元 , 它们 的 类 别称 为 单元 类 型 ， 开启 一 个 单元 称 
为 激活 。 

使 用 systemd(1) 帮 助手 册 可 以 查看 所 有 的 单元 类 型 。 这 里 我 们 列 出 了 Unix 系 统 启动 时 需要 使 
用 到 的 单元 类 型 。 

口 服务 单元 : 控制 Unix 上 的 传统 服务 守护 进程 。 
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口 挂 载 单 元 : 控制 文件 系统 的 挂 载 。 
口 目标 单元 : 控制 其 余 的 单元 ， 通 常 是 通过 将 它们 分 组 的 方式 。 
默认 的 启动 目标 通常 是 一 个 目标 单元 , 它 依赖 并 组 织 了 一 系列 的 服务 和 挂 载 单元 。 这样 你 能 
够 很 清楚 地 了 人 解 启动 过 程 的 情况 ， 还 可 以 使 用 systemctl dot 命 令 来 创建 一 个 依赖 关系 树 形 图 。 
你 会 发 现 这 个 树 状 图 会 很 大 ， 因 为 很 多 单元 默认 情况 下 并 不 会 启动 。 

图 6-1 显 示 了 Fedora 系 统 上 的 default.target 单 元 的 部 分 依赖 关系 。 启 动 这 个 单元 时 ， 其 下 的 所 


有 单元 将 被 激活 。 


multi-user.target 


basic.target crond.service syslog.service 


iptables.service 


图 6-1 单元 依赖 关系 树 形 图 


6.4.2 systemd 中 的 依赖 关系 


启动 时 和 运行 时 的 依赖 关系 实际 比 看 上 去 复杂 得 多 , 因为 严格 的 依赖 关系 非常 不 灵活 。 例 如 ， 
如 果 你 想 要 在 数据 库 服 务 启 动 后 显示 登录 提示 符 , 你 可 以 将 登录 提示 符 定 义 为 依赖 于 数据 库 服 务 
器 。 但 是 如 果 数 据 库 服务 器 启动 失败 ,登录 提示 符 也 相应 地 会 启动 失败 ,这样 你 根本 没有 机 会 登 
录 系 统 来 修复 问题 。 

Unix 的 启动 任务 容错 能 力 很 强 , 一 般 的 错误 不 会 影响 那些 标准 服务 的 启动 。 例 如 ， 如 果 一 个 
数据 磁盘 被 从 系统 中 移 除 ， 但 是 /etc/fstab 文 件 仍然 存在 ， 文 件 系统 的 初始 化 就 会 失败 ， 然 而 这 不 
会 太 影响 系统 的 正常 运行 。 

为 了 满足 灵活 和 容错 的 要 求 ，systemd 提 供 了 大 量 的 依赖 类 型 和 形式 。 我 们 在 此 按照 关键 字 
列 出 这 些 类 型 ， 但 是 会 在 6.4.3 节 中 再 详细 介绍 。 基 本 类 型 有 以 下 几 个 。 

口 Requires: 表示 不 可 缺少 的 依赖 关系 。 如 果 一 个 单元 有 此 类 型 的 依赖 关系 ，systemd 会 尝试 

激活 被 依赖 的 单元 ， 如 果 失 败 ，systemd 会 关闭 被 依赖 的 单元 。 
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口 Wants: 表示 只 用 于 激活 的 依赖 关系 。 单 元 被 激活 时 ， 它 的 Wants 类 型 的 依赖 关系 也 会 被 
systemd 激 活 ， 但 是 systemd 不 关心 激活 成 功 与 否 。 

口 Requisite: 表示 必须 在 激活 单元 前 激活 依赖 关系 。systemd 会 在 激活 单元 前 检查 其 Requisite 
类 型 依赖 关系 的 状态 。 如 果 依 赖 关系 还 没有 被 激活 ， 单 元 的 启动 也 会 失败 。 

口 Conflicts: 反 向 依赖 关系 。 如 果 一 个 单元 有 Conflict 类 型 的 依赖 关系 ， 且 它们 已 经 被 激活 ， 
systemd 会 自动 关闭 它们 。 同 时 启动 两 个 有 反 向 依赖 关系 的 单元 会 导致 失败 。 


注解 Wants 是 一 种 很 重要 的 依赖 关系 ， 它 不 会 将 启动 错误 扩散 给 其 他 单元 。systemd 文 档 鼓 
励 我 们 尽 可 能 使 用 这 种 依赖 关系 。 原 因 显 而 易 见 : 它 让 系统 容错 性 更 强 ， 有 点 像 传统 
的 init。 


你 还 可 以 设 定 反 向 的 依赖 关系 。 例 如 ， 如 果 要 将 单元 A 设 定 为 单元 B 的 Wants 依 赖 ， 除 了 在 单元 
B 的 配置 中 设置 Wants 依 赖 关系 , 你 还 可 以 在 单元 A 的 配置 中 设置 反 向 依赖 关系 WantedBy。 同样 的 还 
有 RequiredBy。 设 定 反 向 依赖 除了 编辑 配置 文件 外 , 还 涉及 其 他 的 一 些 内 容 , 我 们 将 在 6.4.3 节 介绍 。 

只 要 你 指定 一 个 依赖 关系 的 类 型 ， 如 Wants 或 Requires， 就 可 以 使 用 systemct1 命 令 来 查看 单 
元 的 依赖 关系 : 


# systemctl] show -p type unit 


依赖 顺序 

到 目前 为 止 ， 依赖 关系 没有 涉及 顺序 。 上 默认 情况 下 ，systemd 会 在 启动 单元 的 同时 启动 其 所 
有 的 Requires 和 Wants 依 赖 组 件 。 理 想 情况 下 ,我们 试图 尽 可 能 多 、 尽 可 能 快 地 启动 服务 以 缩短 启 
动 时 间 。 不 过 有 时 候 单 元 必须 顺序 启动 。 如 图 6-1 中 显示 的 那样 ，defaulttarget 单 元 被 设 定 为 在 
multi-user.service 之 后 启动 ( 图 中 未 说 明 顺 序 )。 
你 可 以 使 用 下 面 的 依赖 关键 字 来 设 定 顺序 。 
口 Before: 当前 单元 会 在 Before 中 列 出 的 单元 之 前 启动 。 例 如 ， 如 果 Before=bar.target 出 现在 
foo.target 中 ，systemd 会 完 启动 foo.target， 然 后 是 bar.target。 
口 After: 当前 单元 在 After 中 列 出 的 单元 之 后 启动 。 
依赖 条 件 
下 面 我 们 列 出 一 些 systemd 中 没有 使 用 ， 但 是 其 他 系统 使 用 的 依赖 条 件 关 键 字 。 
口 ConditionPathExists=p: 如 果 文 件 路 径 p 存 在 ， 则 返回 true。 
口 ConditionPathIsDirectory=p: 如 果 p 是 一 个 目录 ， 则 返回 true。 
口 ConditionFileNotEmpty=p: 如 果 p 是 一 个 非 空 的 文件 ， 则 返回 true。 

如 果 单 元 中 的 依赖 条 件 为 false， 单 元 不 会 被 启动 ， 不 过 依赖 条 件 只 对 其 所 在 的 单元 有 效 。 
如 果 你 启动 的 单元 中 包含 依赖 条 件 和 其 他 依赖 关系 ， 无 论 依赖 条 件 为 true 还 是 false，systemd 都 
会 启动 依赖 关系 。 

其 他 的 依赖 关系 基本 是 上 述 依赖 关系 的 变种 , 如 : RequiresOverridable 正 常情 况 下 像 Requires ， 
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但 如 果 单 元 手动 启动 ， 则 像 Wants。( 可 以 使 用 systemd.unit(5) 帮 助手 册 查 看 完整 列表 。 ) 
至 此 我 们 介绍 了 systemd 配 置 的 一 些 内 容 ， 下 面 我 们 将 介绍 单元 文件 。 


6.4.3 systemd 配 置 


systemd 配 置 文件 分 散在 系统 的 很 多 目录 中 ， 不 止 一 处 。 但 主要 是 分 布 在 两 个 地 方 : 系统 单 
元 目录 (全 局 配置 ， 一 般 是 /usr/lib/systemd/system ) 和 系统 配置 目录 ( 局 部 配置 ， 一 般 是 
/etc/systemd/system )。 

简单 来 说 ， 记 住 这 个 原则 即 可 : 不 要 更 改 系统 单元 目录 ， 因 为 它 由 系统 来 维护 。 可 以 在 系统 
配置 目录 中 保存 你 的 自 定义 设置 。 在 选择 更 改 /usr 还 是 更 改 /etc 时 ， 永 远 选 择 /etc。 


注解 ”你 可 以 使 用 以 下 命令 来 查看 当前 的 systemd 配 置 的 搜索 路 径 : 


# Systemct] -p UnitPath show 


该 设置 信息 来 自 pkg-config。 你 可 以 使 用 以 下 命令 来 查看 系统 单元 和 配置 目录 : 


$ pkg-config systemd --variable=systemdsystemunitdir 
$ pkg-config systemd --variable=systemdsystemconfdir 


单元 文件 

单元 文件 是 由 XDG 桌 面条 目 规范 (XDG Desktop Entry Specification ，.desktop 文 件 ， 类 似 
Windows 中 的 .ini 文 件 ) 演变 而 来 ，[] 中 的 是 区 块 名 称 ， 每 个 区 块 包含 变量 和 变量 值 。 

我 们 来 看 一 看 Fedora 系 统 中 /usr/lib/systemd/system 目 录 下 的 media.mount 单 元 文件 。 该 文件 是 
针对 /media tmpfs 文 件 系 统 的 ， 这 个 目录 负责 可 移动 媒体 的 挂 载 。 


[Unit] 
Description=Media Directory 
Before=local-fs.target 


[Mount] 

What=tmpfs 

Where=/media 

Type=tmpfs 

Options=mode=755, nosuid,nodev, noexec 


上 面 有 两 个 区 块 ， 区 块 [Unit] 包 含 单元 信息 和 依赖 信息 ， 该 单元 被 设 定 为 在 local-fs.target 单 
元 之 前 启动 。 

区 块 [Mount] 表 示 该 单元 一 个 挂 载 单元 ， 包 含 挂 载 点 信息 、 文 件 系 统 类 型 和 挂 载 选 项 ( 参考 
4.2.6 节 )。What= 变 量 定义 了 挂 载 的 设备 或 者 设备 的 UUID。 本 例 中 是 tmpfs， 因 为 它 没有 对 应 的 设 
备 。( 可 以 参考 systemd.mount(5) 帮 助手 册 查 看 全 部 挂 载 单 元 选项 。 ) 

其 他 单元 配置 文件 也 很 简单 。 例 如 ， 下 面 的 服务 单元 文件 sshd.service 启 动 安全 登录 shell: 
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[Unit] 
Description=OpenSSH server daemon 
After=syslog.target network.target auditd.service 


[Service] 
EnvironmentFile=/etc/sysconfig/sshd 
ExecStartPre=/usr/sbin/sshd-keygen 
ExecStart=/usr/sbin/sshd -D $0PTIONS 
ExecReload=/bin/kill -HUP $MAINPID 


[Install] 
WantedBy=multi-user.target 


这 是 一 个 服务 目标 ， 详 细 信息 在 [service] 区 块 中 ,包括 服务 如 何 准备 就 绪 、 如 何 启 动 和 重 
新 启动 。 你 可 以 在 systemd.exec(5) 帮 助手 册 中 查看 完整 的 列表 ， 男 外 在 6.4.6 一 节 中 也 有 介绍 。 

开启 单元 和 [Install] 区 块 

sshd.service 单 元 文件 中 的 [Install] 区 块 很 重要 ， 因 为 它 告诉 我 们 怎样 使 用 systemd 的 
WantedBy 和 RequiredBy 依 赖 关 系 。 它 能 够 开启 单元 ,同时 不 需要 任何 对 配置 文件 的 更 改 。 正 常情 
况 下 systemd 会 忽略 [Install] 部 分 。 然 而 在 某 种 情况 下 ， 系 统 中 的 sshd.service 被 关闭 ， 你 需要 开 
启 它 。 你 开启 一 个 单元 的 时 候 ，systemd 读 取 [Install] 区 块 。 这 时 ， 开 启 sshd.service 单 元 就 需要 
systemd 去 查看 multi-user.target 的 WantedBy 依 赖 关 系 。 相 应 地 ，systemd 在 系统 配置 目录 中 创建 一 
个 符号 链接 来 指向 sshd.service， 如 下 所 示 : 


ln -s '/usr/lib/systemd/system/sshd.service' '/etc/systemd/system/multi-user. 
target .wants/sshd.service" 


注意 ， 该 符号 链接 创建 于 被 依赖 的 单元 所 对 应 的 子 目录 中 (multi-usertarget 的 子 目录 )。 

[Instal1] 区 块 通常 对 应 系统 配置 目录 ( /etc/sytemd/system ) 中 的 .wants 和 .requires 目 录 。 不 过 
在 单元 配置 目录 ( /usr/lib/systemd/system ) 中 也 有 .wants 目 录 ， 你 可 以 在 单元 文件 中 创建 无 关 
[Install] 区 块 的 符号 链接 。 这 种 方法 让 你 可 以 不 用 更 改 单元 文件 就 能 够 加 入 依赖 关系 ， 因 为 单 
元 文件 有 可 能 被 系统 更 新 窗 盖 。 


注解 ”开启 (enable ) 单元 和 激活 (activate ) 单元 不 同 。 开 启 单 元 是 指 你 将 其 安装 到 systemd 的 
配置 中 ， 做 一 些 在 重启 后 会 保留 的 非 永久 性 的 更 改 。 不 过 你 并 非 总 是 需要 明确 地 开启 单 
元 。 如 果 单 元 文件 包含 [Install] 区 块 ， 你 就 需要 通过 systemctl enable 来 开启 。 否 则 单 
元 文件 本 身 就 足以 完成 开启 。 当 你 使 用 systemctl start 来 激活 单元 时 ， 你 只 是 在 当前 运 
行 时 环境 中 打开 它 。 此 外 ， 开 局 单元 并 不 意味 着 激活 单元 。 


变量 和 说 明 符 
sshd.service 单 元 文件 还 包含 了 一 些 变量 ， 如 systemd 传 递 过 来 的 $oPTIONS 和 $MAINPID 环 境 变 
量 。 当 你 使 用 systemct1 激 活 单元 时 ， 可 以 用 $opPTIONS 变 量 为 sshd 设 定 选项 。4MAINPID 是 被 追踪 的 
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服务 进程 ( 参考 6.4.6 节 )。 
说 明 符 ( specifier ) 是 单元 文件 中 另 一 种 类 似 变 量 的 机 制 ， 前 缀 为 %。 例 如 ，%n 代 表 当 前 单 

元 的 名 称 ，%H 代 表 当 前 主机 名 。 

注解 单元 名 中 可 以 包含 一 些 说 明 符 。 你 可 以 为 单元 文件 使 用 参数 来 启动 一 个 服务 的 多 个 实例 ， 
例如 在 tty1 和 tty2 上 运行 的 getty 进 程 。 你 可 以 在 单元 文件 名 末尾 加 上 @@ 来 使 用 说 明 符 。 比 
如 对 getty 来 说 ， 你 可 以 创建 一 个 名 为 getty@.service 的 单元 文件 ， 该 文件 代表 getty@Qtty1 和 
getty@tty2 这 样 的 单元 。@ 之 后 的 内 容 我 们 称 为 实例 ， 在 单元 文件 执行 时 ，systemd 展 开 
%I 说 明 符 。 在 大 多 数 运行 Systemd 的 系统 中 ,你 可 以 找到 getty@.service 并 看 看 它 实际 是 怎 
样 工作 的 。 


6.4.4 ”systemd 操 作 


我 们 主要 通过 systemct1 命 令 与 systemd 进 行 诸 如 激活 服务 、 关 闭 服务 、 显 示 状 态 、 重 新 加 载 
配置 等 的 交互 操作 。 

最 基本 的 命令 主要 用 于 获取 单元 信息 。 例 如 ， 使 用 list-units 命 令 来 显示 系统 中 所 有 激活 的 
单元 (实际 上 这 是 systemct1 的 默认 命令 ， 你 不 需要 指定 list-units 部 分 ): 


$ systemct] list-units 


输出 结果 是 典型 的 Unix 列 表 形 式 ， 如 下 所 示 : 


UNIT LOAD ACTIVE SUB JOB DESCRIPTION 
media.mount loaded active mounted Media Directory 


该 命令 的 输出 有 很 多 信息 ， 因 为 系统 中 有 大 量 的 激活 单元 。 由 于 systemct1 会 将 长 单元 名 截 
短 ， 可 以 使 用 --full 选 项 来 查看 完整 的 单元 名 。 使 用 --all 选 项 查看 所 有 单元 ( 包括 未 激活 的 )。 
另 一 个 很 有 用 的 systemct1 操 作 是 获得 单元 的 状态 信息 。 下 例 是 典型 的 状态 命令 和 输出 结果 。 


$ Systemct1 status media.mount 
media.mount - Media Directory 
Loaded: loaded (/usr/lib/systemd/system/media.mount; static) 
Active: active (mounted) since Wed, 13 May 2015 11:14:55 -0800; 
37min ago 
Where: /media 
What: tmpfs 
Process: 331 ExecMount=/bin/mount tmpfs /media -t tmpfs -0 
mode=755,nosuid,nodev,noexec (code=exited, status=0/SUCCESS) 
CGroup: name=systemd:/system/media.mount 


这 里 输出 的 信息 比 传统 的 init 系 统 多 很 多 : 不 仅仅 是 该 单元 的 状态 ， 还 有 执行 挂 载 的 命令 、 


图 灵 社 区 会 员 小 虎 (164142021@qq.com) 专 享 尊重 版 权 


6.4 Systemd 97 


PID 和 退出 状态 。 

输出 结果 中 最 有 意思 的 信息 是 控制 组 名 。 在 上 例 中 , 控制 组 除了 systemd:/system/media.mount 
这 个 名 称 之 外 并 不 包括 其 他 信息 ， 因 为 单元 处 理 过 程 这 时 已 经 终止 了 。 然 而 如 果 你 从 
NetworkManager.service 这 样 的 服务 单元 获得 状态 信息 , 你 就 能 看 到 控制 组 的 进程 树 结构 。 你 可 以 
使 用 system-cgls 命 令 来 查看 控制 组 。 详 细 内 容 我 们 将 在 6.4.6 节 介绍 。 

status 命 令 还 显示 最 新 的 单元 日 志 信息 。 你 可 以 使 用 以 下 命令 查看 完整 的 单元 日 志 : 


$ journalct1 _SYSTEMD UNIT=wnit 


( 它 的 语法 有 一 点 奇怪 , 因为 journalct1 不 仅 用 来 显示 systemd 单 元 日 志 , 还 用 来 显示 其 他 日 志 。 ) 
你 可 以 使 用 systemd start、stop 和 restart 命 令 来 激活 、 关 闭 和 重启 单元 。 但 如 果 你 更 改 了 
单元 配置 文件 ， 你 可 以 使 用 以 下 两 种 方法 让 systemd 重 新 加 载 文件 。 
口 systemctl reload unit: 只 重新 加 载 unit 单 元 的 配置 。 
口 systemct] daemon-reload: 重新 加 载 所 有 的 单元 配置 。 
在 systemd 中 ,我们 将 激活 、 关 闭 和 重启 单元 称 为 任务 (job ), 它们 本 质 上 是 对 单元 状态 的 变 
更 。 你 可 以 用 以 下 命令 来 查看 系统 中 的 当前 任务 : 


$ systemct] list-jobs 


如 果 已 经 运行 了 一 段 时 间 , 系统 中 可 能 已 经 没有 任何 激活 的 任务 , 因为 所 有 激活 工作 应 该 已 
经 完成 。 然 而 ,在 系统 启动 时 ， 如 果 你 很 快 登录 系统 ,你 可 以 看 到 一 些 单元 正在 慢 慢 被 激活 ， 如 
下 所 示 : 


JOB UNIT TYPE STATE 

1 graphical.target start waiting 

2 multi-user.target start waiting 
71 systemd-...nlevel.service start waiting 
75 sm-client.service start waiting 
76 sendmail.service start running 
120 systemd-...ead-done.timer start waiting 


上 例 中 的 任务 76 是 sendmail.service 单 元 , 它 的 启动 花 了 很 长 时 间 。 其 他 的 任务 处 于 等 待 状态 ， 
它们 很 有 可 能 是 在 等 待 任务 76。 任务 76 在 sendmail.service 启 动 完成 时 会 终止 , 其 余 的 任务 会 继续 ， 
直到 任务 列表 完全 清空 。 


注解 ”任务 这 个 词 可 能 不 太 好 理解 ， 特 别 是 我 们 在 本 章 介 绍 过 的 Upstart 也 使 用 它 来 代表 systemd 
中 的 单元 。 有 一 点 需要 注意 ， 单 元 能 够 使 用 任务 来 启动 ， 任 务 完 成 后 会 终止 。 单 元 ， 特 
别 是 服务 单元 ， 在 没有 任务 的 情况 下 也 能 够 被 激活 和 运行 。 


我 们 将 在 6.7 节 介绍 如 何 关闭 和 重 局 系统 。 
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6.4.5 在 systemd 中 添加 单元 


在 systemd 中 添加 单元 涉及 创建 和 激活 单元 文件 ， 有 时 候 还 需要 开启 单元 文件 。 将 单元 文件 
放 入 系统 配置 目录 /etc/systemd/system, 这 样 你 就 不 会 将 它们 与 系统 自 带 的 配置 混淆 起 来 , 它们 也 
不 会 被 系统 更 新 覆盖 了 。 

创建 一 个 什么 都 不 做 的 目标 单元 很 简单 ， 你 可 以 自己 试 一 试 。 我 们 来 创建 两 个 目标 ， 
个 依赖 于 另 一 个 。 

(1) 创建 一 个 名 为 testl.target 的 单元 : 


其 中 一 


-~ 


[Unit] 
Description=test 1 


(2) 创建 test2.target， 其 依赖 于 testl.target: 


[Unit] 
Description=test 2 
Wants=test1.target 


(3) 激活 test2.target 单 元 ( testl.target 作 为 依赖 关系 也 会 被 激活 ): 


# systemctl] start test2.target 


(4) 验证 两 个 单元 都 被 激活 : 


# Systemct1 status test1.target test2.target 

test1.target - test 1 
Loaded: loaded (/etc/systemd/system/test1.target; static) 
Active: active since Thu, 12 Nov 2015 15:42:34 -0800; 10s ago 


test2.target - test 2 
Loaded: loaded (/etc/systemd/system/test2.target; static) 
Active: active since Thu, 12 Nov 2015 15:42:34 -0800; 10s ago 


注解 ”如 果 单 元 文件 中 包含 [Install] 区 块 ， 你 需要 在 激活 前 开启 它 : 


# systemctl] enable uwnit 


你 可 以 在 上 例 中 运行 上 面 这 个 命令 。 将 依赖 关系 从 test2.target 中 去 掉 ， 在 testl,target 加 上 
[Install] 区 块 WantedBy=test2.target。 


删除 单元 
使 用 以 下 步骤 来 删除 单元 。 
(1) 必要 时 关闭 单元 : 


# Systemct1 stop wnit 
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(2) 如 果 单 元 中 包含 [Install] 区 块 ， 则 通过 关闭 单元 来 删除 依赖 的 符号 链接 : 


# systemctl disable wnit 


(3) 这 时 你 就 可 以 删除 单元 文件 了 。 


6.4.6 systemd 进 程 跟踪 和 同步 


对 于 启动 的 进程 ，systemd 需 要 掌握 大 量 的 信息 和 控制 权 。 最 大 的 问题 是 启动 一 个 服务 的 方 
式 有 多 种 。 这 样 导致 的 后 果 是 ， 可 能 会 义 分 ( fork ) 出 许多 新 实例 ， 甚 至 还 可 能 会 将 其 作为 守护 


进程 并 且 同 原始 进程 脱离 开 。 

为 了 减 小 开发 人 员 或 系统 管理 员 创建 单元 文件 所 需 的 工作 量 ，systemd 引 进 了 控制 组 ， 它 是 
Linux 内 核 的 一 个 可 选 特性 ， 为 的 是 提供 更 好 的 进程 跟踪 。 如 果 你 接触 过 Upstart 就 知道 ， 为 了 找 
到 一 个 服务 的 主 进程 ， 需 要 做 一 些 额外 的 工作 。 在 systemd 中 ， 你 不 需要 担心 一 个 进程 被 又 分 了 
多 少 次 , 只 需要 知道 它 能 不 能 被 叉 分 。 你 可 以 在 服务 单元 文件 中 使 用 Type 选项 来 定义 其 启动 行为 。 
启动 行为 有 以 下 两 种 。 

口 Type=simple: 服务 进程 不 能 又 分 。 
口 Type=forking: systemd 和 希望 原始 的 服务 进程 在 又 分 后 终止 ， 原 始 进程 终止 时 ，systemd 视 
其 为 服务 准备 就 绪 。 

Type=simple 选 项 并 不 负责 服务 花 多 长 时 间 启 动 ，systemd 也 不 知道 何 时 启动 该 服务 的 依赖 关 
系 。 解 决 这 个 问题 的 一 个 办 法 是 使 用 延 时 启动 (参考 6.4.7 节 )。 不 过 我 们 可 以 使 用 Type 来 让 服务 
就 绪 时 通知 systemd。 

口 Type=notify: 服务 在 就 绪 时 向 systemd 发 送 通知 (使 用 sd_notifiy() 函 数 )。 
口 Type=dbus: 服务 在 就 绪 时 间 D-Bus ( Desktop Bus ) 注册 自己 。 

另外 还 有 一 个 服务 启动 类 型 是 Type=oneshot ， 其 中 服务 进程 在 完成 任务 后 会 彻底 终止 。 对 于 
这 种 启动 类 型 ， 基 本 上 你 都 需要 加 上 RemainAfterExit=yes 选 项 来 确保 systemd 在 服务 进程 终止 后 
仍然 将 服务 状态 视 作 激 活 。 

最 后 还 有 一 个 类 型 Type=idle， 意 思 是 在 当前 没有 任何 激活 任务 的 情况 下 ，systemd 才 会 激活 该 
服务 。 这 个 类 型 主要 是 用 于 等 其 他 服务 都 启动 完成 后 , 再 启动 制定 的 服务 , 这 样 可 以 减轻 系统 负载 ， 
还 可 以 避免 服务 启动 过 程 之 间 的 交叉 。( 请 记 住 ， 服 务 启 动 后 ， 启 动 服务 的 systemd 任 务 即 终止 。) 


6.4.7 systemd 的 按 需 和 资源 并 行 启动 


systemd 的 一 个 最 主要 的 特性 是 它 可 以 延迟 启动 单元 ， 直 到 它们 真正 被 需要 为 止 。 配 置 方式 
如 下 所 示 。 

(1) 为 系统 服务 创建 一 个 systemd 单 元 (单元 A )。 

(2) 标识 出 单元 A 需 要 为 其 服务 提供 的 系统 资源 ， 如 网 络 端口 、 网 络 套 接 字 或 者 设备 。 

(3) 创建 另 一 个 systemd 单 元 (单元 R ) 来 表示 该 资源 。 它 有 特殊 的 单元 类 型 ， 如 套 接 字 单 元 、 
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路 径 单 元 和 设备 单元 。 

其 运行 步骤 如 下 所 示 。 

(1) 单元 R 激 活 的 时 候 ，systemd 对 其 资源 进行 监控 。 

(2) systemd 将 阻止 所 有 对 该 资源 的 访问 ， 对 该 资源 的 输入 会 被 缓冲 。 

(3) systemd 激 活 单元 A。 

(4) 当 单元 A 启 动 的 服务 就 绪 时 ， 其 获得 对 资源 的 控制 ， 读 取 缓 冲 的 输入 ， 然 后 正常 运行 。 

同时 ， 有 以 下 几 个 问题 需要 考虑 。 
D 必须 确保 资源 单元 涵盖 了 服务 提供 的 所 有 资源 。 通 常 这 不 是 大 问题 ， 因 为 大 部 分 服务 只 
有 一 个 单一 的 访问 点 。 
口 必须 确保 资源 单元 与 其 代表 的 服务 单元 之 间 的 关联 。 这 可 以 是 显 式 或 者 是 隐 式 ， 有 些 情 
况 下 ，systemd 可 以 有 许多 选项 使 用 不 同 的 方式 来 调用 服务 单元 。 
口 并 非 所 有 的 服务 器 都 能 够 和 systemd 提 供 的 单元 进行 交互 。 

如 果 你 了 解 诸如 inetd、xinetd 和 automount 这 样 的 工具 ， 你 就 知道 它们 之 间 有 很 多 相似 的 地 
方 。 事 实 上 这 个 概念 本 身 没 什么 新 奇 之 处 ( 实际 上 systemd 包 含 了 对 automount 单 元 的 支持 )。 我 们 
将 在 “ 套 接 字 单 元 和 服务 ”一 节 中 介绍 一 个 套 接 字 的 例子 。 但 是 首先 来 让 我 们 看 看 系统 启动 过 程 
中 资源 单元 的 作用 。 

使 用 辅助 单元 优化 启动 

systemd 在 激活 单元 时 通常 会 试图 简化 依赖 关系 和 缩短 启动 时 间 。 这 类 似 于 按 需 启动 ， 其 中 辅 
助 单元 代表 服务 单元 所 需 的 资源 ， 不 同 的 地 方 是 systemd 在 激活 辅助 单元 之 后 立即 启动 服务 单元 。 

使 用 该 模式 的 一 个 原因 是 ,一些 关键 的 服务 单元 如 syslog 和 dbus 需 要 一 些 时 间 来 启动 ， 有 许 
多 单元 依赖 于 它们 。 然 而 ，systemd 能 快速 地 提供 单元 所 需 的 重要 资源 ( 如 套 接 字 单 元 )， 因 此 它 
不 仅 能 够 快速 启动 这 个 关键 单元 ,还 能 够 启动 依赖 于 它 的 其 他 单元 。 关 键 单元 就 绪 后 ， 就 能 获得 
其 所 需 资 源 的 控制 权 。 
图 6-2 显 示 了 这 一 切 在 传统 系统 中 是 如 何 工 作 的 。 在 启动 时 间 线 上 , 服务 E 提 供 了 一 个 关键 资 
源 R。 服 务 A、B 和 C 依 赖 于 这 个 资源 ， 必 须 等 待 服务 E 先 启动 。 系 统 启动 时 ， 要 局 动 服务 C 需 要 很 
长 一 段 时 间 。 


Service E 


Started; Resource Rready 


Service A 


Sr 


Service B 


Started 


Service C 


图 6-2 ”启动 时 间 顺 序 和 资源 依赖 关系 


| 
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图 6-3 显 示 与 图 6-2 对 应 的 systemd 的 启动 配置 。 有 服务 单元 A、B 、C、E 和 一 个 新 的 单元 R 代 
表单 元 E 提 供 的 资源 。 因 为 systemd 在 单元 E 启 动 时 能 够 为 单元 R 提 供 一 个 接口 ， 单元 A、B、C 和 了 E 
能 够 同时 启动 。 单 元 E 在 单元 R 就 绪 时 接管 。( 有 意思 的 是 ， 如 单元 B 配 置 所 示 ， 单 元 A、B 和 C 并 
不 需要 在 它们 结束 启动 前 显 式 访问 单元 R。 ) 

UnitR 


UnitE 
Started; takes over for Unit R 


UnitA 


UnitC 


图 6-3 ”systemd 启 动 时 间 顺 序 和 资源 单元 


注解 ” 当 并 行 启 动 时 ， 系 统 有 可 能 会 因为 大 量 单 元 同时 启动 而 暂时 变 慢 。 


本 例 中 虽然 并 没有 创建 按 需 启 动 的 单元 ， 但 是 仍然 用 到 了 按 需 启动 的 特性 。 在 日 常 操作 中 ， 
你 可 以 在 运行 systemd 的 系统 中 查看 syslog 和 D-Bus 配 置 单元 。 它 们 大 都 是 以 这 样 的 方式 来 并 行 启 
动 的 。 

套 接 字 单 元 和 服务 实例 

下 面 我 们 看 一 个 实例 , 这 是 一 个 简单 的 网 络 服务 , 使 用 一 个 套 接 字 单元 。 本 节 内 容 涉及 TCP、 
网 络 端口 和 网 络 监听 ， 这 些 内 容 我 们 将 在 第 9 章 和 第 10 章 中 介绍 ， 如 果 你 现在 觉得 不 好 理解 ， 可 
以 暂时 跳 过 。 

本 例 中 服务 的 功能 是 ， 当 网 络 客 户 端 连接 服务 时 , 服务 将 客户 端 发 送 的 数据 原样 发 送 回 客户 
端 。 服 务 单元 使 用 TCP 端 口 22222 来 监听 请 求 。 我 们 将 此 服务 命名 为 回音 服务 ， 它 通过 一 个 套 接 
字 单 元 启动 ， 单 元 内 容 如 下 : 


[Unit] 
Description=echo socket 


[Socket] 


图 灵 社 区 会 员 小 虎 (164142021@qq.com) 专 享 尊重 版 权 


102 第 6 章 用 户 空间 的 启动 


ListenStream=22222 
Accept=yes 


注意 , 在 单元 文件 中 并 没有 提 及 该 套 接 字 支 持 的 服务 单元 , 那么 与 之 相关 的 服务 单元 文件 在 
哪里 呢 ? 

服务 单元 文件 名 是 echo@.service， 两 者 是 通过 命名 规范 来 建立 关联 的 。 如 果 服 务 单元 文件 名 
和 套 接 字 单 元 文件 名 ( echo.socket ) 的 前 级 一 样 , systemd 会 在 套 接 字 单元 有 请 求 时 激活 服务 单元 。 
本 例 中 ， 当 echo.socket 有 请 求 时 ，sytemd 会 创建 一 个 echo@.service 的 实例 。 

以 下 是 echo@.service 单 元 文件 : 


[Unit] 
Description=echo service 


[Service] 
ExecStart=-/bin/cat 
StandardInput=socket 


注解 ”如 果 你 不 喜欢 使 用 前 级 来 隐 式 地 激活 单元 ,或 者 你 需要 激活 有 不 同 前 级 的 单元 ， 你 可 以 
在 单元 中 定义 使 用 的 资源 来 显 式 地 激活 。 例 如 ， 在 foo.service 中 加 入 Socket=bar.socket， 
让 bar.socket 为 foo.service 提 供 它 的 套 接 字 资 源 。 


你 可 以 使 用 下 面 的 命令 来 启动 服务 : 


# Systemct1 start echo.socket 


你 可 以 使 用 telnet 命 令 连接 本 地 端口 22222 来 测试 该 服务 是 否 运行 , 键入 任意 内 容 然 后 回 车 ， 
服务 会 将 你 的 输入 内 容 原样 输出 : 


$ telnet localhost 22222 
Trying 127.0.0.1... 
Connected to localhost. 
Escape character is '^]'. 
Hi there. 

Hi there. 


按 CTRL-]， 然 后 CTRL-D 来 结束 服务 ， 使 用 以 下 命令 停止 套 接 字 单 元 : 


# systemct] stop echo.socket 


实例 和 移交 
echo(@.service 单 元 支持 多 个 实例 同时 运行 ， 其 文件 名 中 含有 @ (在 前 文 注解 中 我 们 介 
@ 代 表 参 数 化 )。 那 么 我 们 为 什么 需要 多 个 实例 呢 ? 因为 很 可 能 会 有 多 个 网 络 客户 端 同时 5 
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服务 ， 每 个 连接 需要 一 个 专属 的 实例 。 

为 echo.socket 中 的 Accept 选 项 ， 服 务 单 元 必须 支持 多 个 实例 。 该 选项 告诉 systemd 在 监听 端 
口 的 同时 接受 呼 入 的 连接 请 求 ， 并 将 连接 传递 给 服务 单元 ， 每 个 连接 是 一 个 单独 的 实例 。 每 个 实 
例 将 连接 作为 标准 输入 ， 从 中 读 取 数据 ， 不 过 实例 并 不 需要 知道 数据 是 来 自 网 络 连接 。 


注解 大 多 数 网 络 连接 除了 需要 与 标准 给 入 输出 的 简单 接口 外 ， 还 需要 更 多 的 灵活 性 。 所 以 本 
例 中 的 echo@.service 只 是 一 个 很 简单 的 例子 ， 实 际 的 网 络 服务 要 复杂 得 多 。 


虽然 服务 单元 可 以 完成 接受 连接 的 所 有 工作 ,但 此 时 它 的 文件 名 中 并 不 包含 @。 在 这 种 情 
况 下 , 它 会 获得 对 套 接 字 的 全 部 控制 权 。systemd 在 服务 单元 完成 任务 前 不 会 试图 去 监听 该 网 络 
端口 。 

由 于 各 种 资源 和 选项 的 差异 , 我 们 无 法 为 资源 移交 给 服务 单元 这 个 过 程 总 结 出 一 个 简单 的 模 
式 。 并 且 这 些 选 项 的 文档 也 分 散在 帮助 手册 中 的 各 个 地 方 。 关 于 资源 相关 单元 的 文档 ,你 可 以 查 
阅 Systemd.socket(5)、systemd.path(5) 和 systemd.device(5)。 关 于 服务 单元 的 一 个 经 常 被 忽略 的 文档 
是 systemd.exec(5)， 它 描述 了 服务 单元 在 激活 时 如 何 获得 资源 的 情况 。 


6.4.8 systemd 的 System V 兼 容 性 


systemd 中 有 一 个 特性 让 其 有 别 于 其 他 的 新 一 代 init 系 统 ， 就 是 对 于 System V 兼 容 init 脚 本 启动 
的 服务 ，systemd 会 尽量 完全 地 进行 监控 。 它 的 工作 流程 如 下 所 示 。 

(1) systemd 首 先 激 活 runlevel<N>.target， 其 中 N 是 运行 级 别 。 

(2) systemd 为 /etc/rc<N>.d 中 的 每 一 个 符号 链接 在 /etc/init.d 中 标识 出 对 应 脚本 。 

(3) systemd 将 脚本 名 和 服务 单元 关联 起 来 (例如: /etc/init.d/foo 对 应 foo.service )。 

(4) systemd 根 据 re<N>.d 中 的 名 称 ， 激 活 服务 单元 ， 使 用 参数 start 或 者 stop 运 行 脚本 。 

(5) systemd 尝 试 关 联 脚 本 进程 和 服务 单元 。 

由 于 systemd 根 据 服务 单元 来 建立 关联 ， 你 可 以 使 用 systemct1 来 重启 服务 和 查看 其 状态 。 不 
过 System V 兼 容 模式 仍然 按 顺 序 执行 init 脚 本 。 


6.4.9 systemd 辅 助 程序 


使 用 systemd 的 时 候 , 你 可 能 会 注意 到 /lib/systemd 目 录 中 有 大 量 的 程序 , 它们 主要 是 单元 的 支 
持 程 序 。 例 如 ， 作 为 systemd 的 一 个 组 成 部 分 ，udevd 对 应 的 程序 文件 是 systemd-udevd。 此 外 ， 程 
序 文件 systemd-fsck 是 作为 systemd 和 fsck 的 “中 间 人 ”而 存在 。 

这 些 程序 很 多 都 有 标准 系统 工具 程序 所 不 具备 的 消息 通知 机 制 。 它们 通常 运行 标准 系统 工具 
程序 ， 然 后 将 执行 结果 通知 给 systemd。( 毕竟 重新 实现 systemd 中 的 fsck 是 不 太 现实 的 。) 
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注解 ”这 些 程序 都 是 使 用 C 编 写 的 ， 因 为 systemd 的 目的 之 一 就 是 减少 系统 中 脚本 文件 的 数量 。 
这 究 竞 是 不 是 个 好 主意 还 有 很 多 争论 ( 毕竟 它们 中 很 多 都 可 以 使 用 脚本 来 实现 ), 不 过 最 
重要 的 是 它们 能 够 稳定 、 安 全 、 快 速 地 运行 ， 至 于 用 脚本 还 是 C 来 编写 则 是 次 要 的 。 


如 果 你 在 /lip/systemd 中 看 到 一 个 不 认识 的 程序 ,你 可 以 查阅 帮助 手册 。 帮 助手 册 很 有 可 能 不 
仅 提供 该 程序 的 信息 ， 还 提供 它 的 单元 类 型 。 
如 果 你 的 系统 中 没有 Upstart， 或 者 你 不 感 兴趣 ， 你 可 以 跳 到 6.6 节 去 了 解 System V init 进 程 。 


6.5 Upstart 


init 的 Upstart 版 本 主要 涉及 任务 和 事件 。 任 务 是 启动 和 运行 时 Upstart 执 行 的 操作 ( 如 系统 服 
务 和 配置 ), 事件 是 Upstart 从 自身 或 者 其 他 进程 ( 如 udevd ) 接收 到 的 消息 。Upstart 通 过 启动 任务 
的 方式 来 响应 消息 。 

为 了 理解 它 的 工作 原理 ， 我 们 来 看 看 启动 udevd 守 护 进 程 的 udev 任 务 。 它 的 配置 文件 通常 是 
/etc/init/udev.conf， 其 中 包含 下 面 的 内 容 : 


start on virtual-filesystems 
stop on runlevel [06] 


它们 表示 Upstart 在 接收 到 virtual-filesystems 
者 6 的 运行 级 别 事件 后 停止 。 
事件 和 它们 的 参数 有 很 多 变种 。 例 如 ，Upstart 能 响应 任务 状态 触发 的 消息 ， 如 udev 任 务 触 发 
的 started udev 事 件 。 在 详细 介绍 任务 之 前 ， 我 们 先 介绍 一 下 Upstart 大 致 的 工作 原理 。 


hl 


和 件 时 启动 udev 任 务 ， 在 接收 到 带 有 参数 0 或 


6.5.1 ” Upstart 初始化 过 程 


Upstart 的 启动 步骤 如 下 : 

(1) 加 载 自身 配置 和 /etc/init 中 的 任务 配置 文件 ; 

(2) 产生 startup 事 件 ; 

(3) 启动 那些 响应 startup 事 件 的 任务 ; 

(4) 这 些 任务 产生 各 自 的 事件 ， 触 发 更 多 的 任务 和 事件 。 

在 完成 所 有 正常 启动 相关 的 任务 之 后 ，Upstart 继 续 监 控 和 响应 系统 运行 时 产生 的 事件 。 

大 多 数 Upstart 的 安装 步骤 如 下 所 示 。 

(1) 在 Upstart 响 应 startup 事 件 所 运行 的 任务 中 ，mountall 是 最 重要 的 一 个 。 它 为 系统 挂 载 所 
有 必要 的 本 地 和 虚拟 文件 系统 ， 以 保障 系统 其 他 部 分 能 够 运行 。 

(2) mountall 任 务 会 产生 一 些 事件 ,包括 filesystem、virtual-filesystems、local-filesystems、 
remote-filesystems 和 all-swaps 等 。 它 们 表示 这 些 重要 的 文件 系统 已 经 挂 载 完毕 并 准备 就 绪 。 
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(3) 为 了 响应 这 些 事件 ，Upstart 启 动 一 系列 的 服务 。 例 如 ， 为 virtual-filesystems 事 件 启动 
udev， 为 local-filesystems 事 件 启动 dbus。 

(4) 在 local-filesystems 事 件 和 udevd 就 绪 时 ，Upstart 启 动 network-interfaces 任 务 。 

(5) network-interfaces 任 务 产生 static-network-up 事 件 。 

(6) Upstart 为 响应 filesystem 和 static-network-up 事 件 运 行 rs-sysinit 任 务 。 该 任务 负责 维护 系 
统 当前 的 运行 级 别 ， 在 第 一 次 没有 运行 级 别 启动 时 ， 它 通过 产生 runlevel 事 件 将 系统 切换 到 默认 
的 运行 级 别 。 

(7) 为 了 响应 runlevel 事 件 和 新 的 运行 级 别 ，Upstart 运 行 系统 中 的 其 他 大 部 分 启动 任务 。 

这 个 过 程 可 能 会 变 得 很 复杂 ,因为 事件 产生 的 源头 并 不 总 是 很 清晰 。Upstart 本 身 只 产生 几 个 
事件 ， 其 余 的 都 来 自任 务 。 任 务 配置 文件 通常 都 声明 了 它们 会 产生 的 事件 , 但 是 产生 事件 的 细节 
往往 不 在 Upstart 任 务 配置 文件 中 。 

为 了 和 弄 清 事情 的 本 质 ， 通 常 你 需要 深入 挖掘 。 以 static-network-up 事 件 为 例 ，network- 
interface.conf 任 务 配置 文件 声明 了 它 会 产生 该 事件 ， 但 是 没 说 从 哪里 产生 。 我 们 发 现 事 件 来 自 于 
ifup 命 令 ， 它 是 由 该 任务 使 用 脚本 /etc/network/if-up.d/upstart 来 初始 化 网 络 接口 时 运行 的 。 


注解 虽然 所 有 的 这 些 过 程 都 有 文档 ( ifup.d 目 录 在 帮助 手册 interfaces(5) 中 能 找到 ，ifup(8) 帮 助 
手册 引用 了 这 部 分 内 容 )， 但 是 光 靠 阅读 文档 来 理解 整个 工作 原理 并 不 是 一 件 简单 的 事 。 
更 快 的 方法 是 使 用 grep 在 配置 文件 中 搜索 事件 名 称 来 查看 相关 的 内 容 。 


Upstart 的 一 个 问题 是 没有 办 法 清晰 地 查看 事件 的 来 龙 去 脉 。 你 可 以 将 它 的 日 志 优 先 级 设置 为 
debug， 这 样 你 可 以 看 到 所 有 的 日 志 信 息 (通常 在 /var/log/syslog 中 ), 但 是 大 量 的 信息 会 让 人 难以 
查找 事件 的 相关 内 容 。 


6.5.2 ” Upstart 任务 


Upstart 的 /etc/init 配 置 目录 中 的 每 个 文件 都 对 应 一 个 任务 ， 每 个 任务 的 主 配 置 文件 都 有 .conf 
后 级 。 例 如 ，/etc/init/mountall.conf 即 针对 mountall 任 务 。 

Upstart 任 务 主要 分 为 以 下 两 大 类 。 

口 Task 任 务 : 这 些 任务 会 在 某 一 明确 的 时 刻 终 止 。 例 如 ，mountall 就 是 一 个 task 任 务 ， 它 在 

挂 载 完 文件 系统 后 终止 。 

口 Service 任 务 : 这 些 任 务 没有 明确 的 终止 时 间 。 像 udevd 这 样 的 守护 服务 进程 、 数 据 库 服务 
器 和 网 络 服务 器 都 属于 service 任 务 。 

还 有 第 三 种 任务 叫 抽象 任务 ， 也 可 以 把 它们 看 成 是 虚拟 的 service 任 务 。 它 们 只 存在 于 
Upstart 中 , 本身 什么 都 不 运行 , 不 过 有 时 候 其 他 任务 的 管理 工具 会 使 用 它们 产生 的 事件 来 启动 
和 停止 任务 。 

查看 任务 
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你 可 以 使 用 initct1 命 令 来 查看 Upstart 任 务 和 状态 。 下 面 的 命令 用 来 查看 整个 系统 的 运行 


$ initct1 list 


它 输 出 的 内 容 很 多 ， 我 们 来 看 两 个 比较 有 代表 性 的 任务 : 


mountall stop/waiting 


上 例 显 示 ，mountall 的 task 任 务 状态 为 stop/waiting， 意 思 是 并 未 运行 。( 但 很 遗憾 ， 到 本 书 成 
书 为 止 , 你 还 不 能 根据 状态 信息 来 确定 任务 是 否 已 经 运行 过 ， 因 为 stop/waiting 状 态 还 有 可 能 表示 
任务 从 来 未 被 运行 过 。) 

有 关联 进程 的 service 任 务 的 状态 显示 如 下 : 


tty1 start/running, process 1634 


上 例 表 示 tty1 任 务 正在 运行 , 与 之 关联 的 进程 卫 为 1634。( 不 是 所 有 的 service 任 务 都 有 关联 的 
进程 。) 


注解 ”如 果 你 知道 任务 的 名 称 ， 你 可 以 直接 使 用 initctl status job 查看 任务 状态 。 


initct1 输 出 结果 中 的 状态 ( 如 stop/waiting ) 可 能 会 让 人 有 些 不 解 。 左 边 ( /之 前 ) 的 部 分 是 
目标 ， 或 者 说 是 任务 将 要 达到 的 状态 ， 如 start 或 stop。 右 边 的 部 分 是 任务 的 当前 状态 ， 如 waiting 
或 running。 例 如 上 面 的 例子 中 ，tty1 任 务 的 状态 是 staryrunning ， 意 思 是 它 的 目标 是 start， 而 状态 
running 表 示 它 已 经 启动 成 功 。( 对 于 service 任 务 来 说 ， 状 态 running 只 是 象征 性 的 。) 

mountalT 则 有 一 些 不 同 ， 因 为 task 任 务 不 持续 运行 。 状 态 stop/waiting 通 常 表示 任务 已 经 启动 
并 且 执 行 完毕 。 在 执行 完毕 时 ， 它 从 目标 start 切 换 至 stop， 等 待 来 自 Upstart 的 后 续 指 令 。 

但 之 前 提 过 ,状态 为 stop/waiting 的 任务 也 可 能 从 未 启动 过 。 所 以 除非 你 开始 调试 功能 来 查看 
日 志 ， 否 则 单 从 状态 上 无 法 分 辩 任 务 是 已 经 执行 完毕 还 是 从 未 启动 。 详 见 6.5.5 节 。 


注解 ”你 无 法 查看 那些 通过 Upstart 的 System V 兼 容 特性 启动 的 任务 。 


任务 状态 转换 

任务 状态 有 很 多 种 , 但 是 它们 之 间 的 转换 方式 很 固定 。 例 如, 通常 任务 是 按照 下 列 步 又 启动 的 。 
(1) 所 有 的 任务 起 始 状态 为 stop/waiting。 

(2) 当 用 户 或 者 系统 事件 触发 任务 时 ， 任 务 目标 从 stop 变 为 start。 

(3) Upstart 将 任务 状态 从 waiting 变 为 starting， 从 而 当前 状态 为 start/starting。 

(4) Upstart 产 生 starting job 事件 。 
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(5) 任务 执行 starting 状 态 的 相关 操作 。 

(6) Upstart 将 任务 状态 从 starting 变 为 pre-start， 并 产生 pre-start job 事件 。 

(7) 任务 经 过 数 次 状态 转换 ， 最 终 变 为 running 状 态 。 

(8) Upstart 产 生 started job 事件 。 

任务 的 终止 也 涉及 一 系列 类 似 的 状态 转换 和 事件 。( 可 以 查阅 upstart-events(7) 帮 助手 册 。 ) 


6.5.3 Upstart 配置 


我 们 来 看 一 下 这 两 个 配置 文件 : 一 个 是 task 任 务 mountall， 另 一 个 是 service 任 务 tty1。 和 所 有 
的 Upstart 配 置 文件 一 样 , 它们 存放 在 目录 /etc/init 下 , 文件 名 为 mountallconf 和 ttyl1.conf。 配置 文件 
由 更 小 的 节 〈stanza ) 组 成 。 每 个 节 开 头 是 一 个 关键 字 ， 诸 如 description 和 start 等 。 
首先 我 们 可 以 打开 mountall.conf 文 件 ， 在 第 一 个 节 中 寻找 以 下 内 容 : 


description "Mount filesystems on boot" 


该 行 包含 了 对 任务 的 简短 文字 描述 。 
接 下 来 的 几 个 节 描 述 mountall 任 务 如 何 启 动 : 


start on startup 
stop on starting rcS 


第 一 行 告 诉 Upstart 在 接收 到 startup 事 件 (Upstart 产 生 的 第 一 个 事件 ) 时 启动 任务 。 第 二 行 
告诉 Upstart 在 接收 到 rcs 事 件 ( 此 时 系统 进入 单 用 户 模 式 ) 时 终止 任务 。 
下 面 两 行内 容 告 诉 Upstart 任 务 mountall 的 运行 方式 : 


expect daemon 
task 


task 告 诉 Upstart 它 是 一 个 task 任 务 ， 因 此 任务 会 在 某 一 时 刻 完 成 。expect 则 有 一 些 复杂 ， 它 
表示 mountall 任 务 会 复制 一 个 守护 进程 ， 且 独立 于 原来 的 任务 脚本 运行 。Upstart 需 要 知道 这 些 信 
息 , 因为 它 需 要 知道 守护 进程 何 时 结束 , 以便 发 送 消息 通知 mountall 任 务 已 经 结束 。( 相关 内 容 我 
们 将 稍 后 介绍 。) 

mountall.conf 文 件 中 还 有 一 些 emits 节 ， 用 来 说 明 任 务 会 产生 哪些 事件 : 


emits virtual-filesystems 
emits local-filesystems 
emits remote-filesystems 
emits all-swaps 

emits filesystem 

emits mounting 

emits mounted 
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注解 ”我 们 在 6.5.1 节 中 提 到 过 ， 这 些 所 谓 的 “ 节 ” 并 不 是 真正 的 事件 源 ， 你 需要 在 任务 脚本 中 
去 寻找 它们 。 


你 还 可 能 会 看 到 console 节 ， 它 表示 Upstart 需 要 将 任务 信息 输出 到 哪里 : 


console output 


output 人 参数 表示 Upstart 尾 mountall 的 任务 信息 输出 到 系统 控制 台 。 
接 下 来 你 会 看 到 任务 的 细节 ， 它 是 一 个 script 节 。 


script 
. /etc/default/rcS 
[ -f /forcefsck ] && force fsck="--force-fsck" 
[ "$FSCKFIX" = "yes" ] && fsck fix="-fsck-fix" 


# set $LANG so that messages appearing in plymouth are translated 
if [ -r /etc/default/locale ]; then 

. /etc/default/locale 

export LANG LANGUAGE LC MESSAGES LC ALL 
fi 


exec mountall --daemon $force fsck $fsck fix 
end script 


这 是 一 个 shell 脚 本 ( 参见 第 11 章 )， 主要 做 一 些 预 备 工作 ， 如 设置 本 地 化 参数 、 判 断 是 否 需 
要 fsck。 其 底部 的 exec mountal1 命 令 执 行 真正 的 操作 。 这 个 命令 的 功能 是 挂 载 文件 系统 ， 并 且 在 
结束 时 产生 任务 需要 的 事件 。 


Service 任 务 tty1 
Service 任 务 tty1 就 简单 得 多 , 它 控制 一 个 虚拟 控制 台 登 录 提示 符 。 它 的 配置 文件 tty1.conf 如 下 : 


start on stopped rc RUNLEVEL=[2345] and ( 
not-container or 
container CONTAINER=]xc or 
container CONTAINER=]xc-libvirt) 


stop on runlevel [12345] 


respawn 
exec /sbin/getty -8 38400 tty1 


该 任务 最 复杂 的 部 分 在 于 它 的 启动 ， 不 过 现在 让 我 们 先 来 看 下 面 这 一 行 : 


start on stopped rc RUNLEVEL=[2345] 


告诉 Upstart 在 接收 到 stopped rc 事件 时 ( 由 Upstart 在 re task 任 务 执行 完毕 时 产生 ) 激活 任 
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务 。 为 了 满足 该 条 件 , rc 任务 还 必须 将 RUNLEVEL 环 境 变 量 设置 为 2~5 之 间 的 某 个 值 (参考 6.5.6 节 )。 


注解 ”其 他 基于 运行 级 别 的 任务 没有 这 么 多 条 件 ， 例 如 : 


start on runlevel [2345] 


本 例 和 前 例 的 区 别 是 启动 时 机 不 同 。 本 例 中 任务 在 runlevel 被 设置 时 启动 ， 而 前 例 则 需要 
等 到 System V 相 关 任 务 结束 才 启 动 。 


容器 ( container ) 配置 文件 之 所 以 存在 ， 是 因为 Upstart 不 仅仅 在 硬件 系统 的 内 核 上 运行 ， 还 
能 够 在 虚拟 环境 和 容器 中 运行 。 一 些 环境 中 没有 虚拟 控制 台 ， 无 法 运行 getty。 
停止 ttyl 任 务 很 简单 : 


stop on runlevel [!2345] 


该 文本 行 告 诉 Upstart 当 运行 级 别 不 是 2 ~ 5 之 间 的 值 的 时 候 停止 任务 ( 例如 在 系统 关闭 时 )。 
最 底部 的 exec 文 本 行 是 这 样 一 个 命令 : 


exec /sbin/getty -8 38400 tty1 


它 类 似 于 你 在 mountall 任 务 中 见 到 的 script 节 , 区别 是 ttyl 任 务 的 设置 很 简单 ,一 行 命令 足够 。 
该 命令 在 /dev/ttyl 上 运行 getty 登 录 提 示 符 程序 ， 它 是 系统 的 第 一 个 虚拟 控制 台 ( 可 以 在 图 形 界面 
中 按 CTRL-ALT-F1 打 开 )。 

Tespawn 文 本 行 告诉 Upstart 任 务 终止 时 重新 启动 tty1 任 务 。 当 你 从 虚拟 控制 台 退 出 时 ，Upstart 
启动 一 个 新 的 getty 登 录 提 示 符 。 

以 上 是 基础 的 Upstart 配 置 。 你 可 以 在 帮助 手册 init(5) 和 在 线 文 档 找到 更 详细 的 内 容 。 有 一 个 
需要 特别 提 及 的 expect 节 ， 将 在 稍 后 介绍 。 

进程 跟踪 和 Upstart 的 expect 节 

Upstart 能 在 任务 启动 后 跟踪 它们 的 进程 〈 因 此 它 才能 执行 终止 和 重启 )， 它 的 任务 是 知道 与 
每 个 任务 相关 联 的 进程 。 这 可 能 会 有 些 困难 ， 因 为 在 传统 的 Unix 启 动 方式 中 , 进程 从 其 他 进程 产 
生 分 支 成 为 守护 进程 , 任务 对 应 的 主 进程 也 许 在 产生 一 两 个 分 支 后 才 启动 。 如 果 没 有 一 个 好 的 跟 
踪 机 制 ，Upstart 很 难 完成 任务 的 启动 ， 也 很 容易 跟踪 到 错误 的 PID。 

我 们 使 用 expect 来 告诉 Upstart 有 关 任 务 执行 的 细节 ， 有 以 下 4 种 情况 。 
口 没有 expect: 表示 任务 的 主 进程 不 产生 分 支 ， 可 直接 跟踪 主 进程 。 
口 expect fork : 表示 进程 产生 一 次 分 文 ， 跟踪 分 支 进 程 。 
口 expect daemon: 表示 进程 产生 两 次 分 支 ， 跟踪 第 二 个 分 支 。 
口 expect stop: 任务 的 主 进 程 会 发 出 SIGSTOP 信 号 , 表示 已 经 准备 就 绪 。( 这 种 情况 很 少见 。 ) 
对 于 Upstart 和 systemd 这 些 新 版 本 的 init 而 言 , 最 好 的 是 第 一 种 情况 ( 没有 expect ), 因为 任务 
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的 主 进程 不 需要 包含 关于 自身 启动 和 关闭 的 机 制 。 另 一 方面 , 它 不 需要 考虑 从 当前 终端 产生 分 支 
和 分 离 ， 这 些 麻烦 的 东西 是 Unix 开 发 者 很 长 时 间 以 来 都 需要 处 理 的 。 

很 多 传统 的 服务 守护 进程 都 包含 调试 选项 ， 让 主 进 程 不 要 产生 分 支 。Secure Shell 守 护 进程 
sshd 及 其 选项 -0 是 其 中 一 个 例子 。 在 下 例 中 , /etc/init/ssh.conf 的 启动 代码 中 包含 启动 sshd 的 一 个 简 
单 配 置 ， 它 防止 了 进程 过 快 的 再 生 ， 并 且 清 除了 很 多 误导 人 的 stderr 输 出 : 


respawn 
respawn limit 10 5 
umask 022 


# 'sshd -D' leaks stderr and confuses things in conjunction with 'console log’' 
console none 


-- Snip-- 


exec /usr/sbin/sshd -D 


对 于 包含 expect 的 任务 来 说 ，expect fork 很 常见 。 例 如 下 面 是 /etc/init/cron.conf 的 启动 部 分 : 


expect fork 
respawn 


exec cron 


这 样 简洁 的 启动 配置 通常 显示 的 是 稳定 安全 的 守护 进程 。 


注解 ”关于 expect 的 内 容 , 推荐 到 upstart.ubuntu.com 站 点 阅读 更 多 的 文档 ,因为 它 和 进程 生命 周 
期 直接 相关 。 比如 , 你 可 以 使 用 strace 命 令 来 跟踪 一 个 进程 和 它 的 系统 调用 , 包括 fork()。 


6.5.4 ” ”Upstart 操作 


除了 6.5.2 节 中 介绍 的 1ist 和 status 命 令 , 你 还 可 以 用 initct1 工 具 来 操控 Upstart 及 其 任务 。 详 
细 信 息 可 阅读 帮助 手册 initct(8)， 但 现在 先 来 看 一 些 基础 内 容 。 
使 用 initct1l start 来 启动 Upstart 任 务 : 


# initctl start job 


使 用 initctl stop 来 停止 任务 : 


# initctl stop job 


重启 任务 使 用 以 下 命令 


# initct1 restart job 
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如 果 想 向 Upstart 发 出 事件 ， 你 可 以 运行 : 


# initct1 emit event 


你 还 可 以 通过 在 event 后 加 上 key=value 参 数 来 向 事件 传递 环境 变量 。 


注解 ”你 无 法 单独 启动 或 者 停止 由 Upstart 的 System V 兼 容 模 式 启动 的 服务 。 可 以 参见 6.6.1 节 来 
了 解 在 System V init 脚 本 中 怎么 做 。 


关闭 Upstart 任 务 以 禁止 其 启动 时 运行 的 方法 有 很 多 种 , 但 可 维护 性 最 高 的 一 种 是 确定 任务 配 
置 文件 的 文件 名 《〈 通常 是 /etc/init/<job>.conf )， 然 后 创建 一 个 /etc/init/<job>.override 文 件 ， 仪 包含 
下 面 一 行内 容 : 


manual 
这 样 ， 唯 一 能 够 启动 任务 的 方式 就 成 了 运行 initctl start job。 
这 个 方法 的 好 处 是 很 容易 撤销 , 如 果 要 在 启动 时 重新 开启 任务 , 只 需要 删除 .override 文 件 即 可 。 


6.5.5 ” Upstart 日 志 


Upstart 中 有 两 种 基本 的 日 志 类 型 : service 任 务 日 志和 由 Upstart 自 己 产生 的 系统 诊断 信息 。 
Service 任 务 日 志 记 录 脚 本 和 运行 服务 的 守护 进程 所 产生 的 标准 输出 和 标准 错误 输出 内 容 。 这些 信 
息 保存 在 /var/log/upstart 中 ， 作 为 服务 产生 的 系统 日 志 的 一 种 补充 ( 关于 系统 日 志 我 们 将 在 第 7 章 
详细 介绍 )。 这 些 日 志 中 的 内 容 很 难 分 类 ， 比 较 常 见 的 内 容 是 启动 和 关闭 消息 ， 以 及 一 些 紧急 错 
误 消 息 。 很 多 服务 根本 不 产生 信息 , 因为 它们 将 所 有 日 志 记 录 到 系统 日 志 或 者 它们 自己 的 日 志 

Upstart 自 带 的 系统 诊断 日 志 :包含 其 何 时 启动 和 重新 加 载 ,还 有 任务 和 事件 的 相关 信息 。 访 日 

志 使 用 内 核 的 系统 日 志 工具 。 在 Ubuntu 上 ， 它 们 通常 保存 在 warlog/kern.log 和 /varvlog/syslog 中 。 
默认 情况 下 ，Upstart 仅 仅 记录 很 少 的 日 志 ， 甚 至 不 记录 日 志 。 如 果 要 查看 日 志 ， 你 必须 更 改 
Upstart 日 志 的 优先 级 。 默 认 优 先 级 是 message。 可 以 将 优先 级 设置 为 info 来 记录 事件 和 任务 信息 : 


# initct1 log-priority info 


需要 注意 的 是 ， 该 设置 会 在 系统 重启 后 重 置 。 你 可 以 在 启动 参数 中 加 上 --verbose 人 参数， 让 
Upstart 在 系统 启动 时 记录 所 有 信息 ， 具 体内 容 可 参考 5.5 节 。 


6.5.6 Upstart 运行 级 别 和 System V 兼 容 性 


到 目前 为 止 ， 我们 介绍 了 Upstart 如 何 支 持 System V 运 行 级 别 ， 也 说 过 它 能 够 将 System V 启 动 
脚本 作为 任务 来 启动 。 下 面 是 它 在 Ubuntu 上 运行 的 详细 情况 。 
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(1) rc-sysinit 任 务 运 行 , 通常 是 在 接收 到 filesystem 和 static-network-up 事 件 后 。 在 其 运行 之 
前 ， 运 行 级 别 没有 设置 。 

(2) rc-sysinit 任 务 决定 进入 哪 一 个 运行 级 别 。 通 常 运行 级 别 是 默认 ， 也 有 可 能 从 较 老 的 
/etc/inittab 文 件 或 者 内 核 参 数 ( jproc/cmdline ) 中 获得 。 

(3) re-sysinit 任 务 运行 telinit 来 切换 运行 级 别 。 该 命令 产生 一 个 runlevel 事 件 ， 在 RUNLEVEL 
环境 变量 中 设置 运行 级 别 值 。 

(4) Upstart 接 收 到 runlevel 事 件 。 每 个 运行 级 别 都 配置 有 一 系列 的 任务 来 响应 runlevel 
由 Upstart 负 责 启动 。 

(5) rc 是 由 运行 级 别 激活 的 任务 之 一 ， 它 负责 运行 System V 启 动 。 和 System V init 一 样 ，rc 运 
行 /etc/init.d/re( 见 6.6 节 )。 

(6) rc 任务 停止 后 ，Upstart 在 接收 到 stopped rc 事件 后 启动 一 系列 其 他 任务 (如 “Service 任 务 
tty1” 一 节 中 介绍 过 的 ttyl )。 

请 注意 ,虽然 Upstart 将 运行 级 别 和 其 他 事件 等 同 对 待 , 但 Upstart 系 统 中 的 很 多 任务 配置 文件 
涉及 运行 级 别 。 

系统 启动 过 程 中 有 一 个 关键 点 , 就 是 当 所 有 文件 系统 都 挂 载 完 毕 ， 大 部 分 重要 系统 都 初始 化 
后 。 此 时 系统 准备 启动 更 高 级 别 的 系统 服务 ， 如 图 形 显示 管理 和 数据 库 服 务 。 此 时 产生 一 个 
runlevel 事 件 以 做 标记 , 你 也 可 以 配置 Upstart 产 生 其 他 事件 。 判断 哪些 服务 作为 Upstart 任 务 启动 、 
哪些 作为 System V 链 接 池 (人 参见 6.6.2 节 ) 启动 不 是 一 件 容易 的 事 。 比 如 你 的 运行 级 别 是 2， 则 
/etc/rc2.d 中 的 任务 很 有 可 能 是 以 System V 兼 容 模式 运行 。 


件 ， 


册 


注解 /etc/init.d 文 件 中 的 伪 脚 本 比较 让 人 头 疫 。 对 于 Upstart 的 service 任务 ，/etc/init.d 中 可 能 有 一 
个 与 之 对 应 的 System V 脚 本 ， 但 是 它 除了 表示 该 服务 已 经 被 转换 为 Upstart 任 务 以 外 ， 并 
没有 其 他 作用 。 也 没有 到 System V 链 接 目 录 脚 本 的 符号 链接 。 如 果 你 看 到 伪 脚 本 ， 你 可 
以 获得 Upstart 任 务 名 ， 然 后 使 用 initct1 来 操控 该 任务 。 


6.6 System V init 


Linux 上 的 System V init 实 现 要 追溯 到 Linux 的 早期 版 本 ， 它 根本 目的 是 为 了 为 系统 提供 合理 
的 启动 顺序 ， 支 持 不 同 的 运行 级 别 。 虽 然 现 在 System V 已 经 不 太 常 见 ， 不 过 在 Red Hat Enterprise 
Linux 和 一 些 路 由 器 和 电话 的 Linux 肯 人 系统 中 还 是 能 够 看 到 System V init。 

典型 的 System V init 安 装 包含 两 个 主要 组 件 : 一 个 核心 配置 文件 和 一 组 启动 脚本 以 及 符号 链 
接 集 。 配 置 文件 /etwinittab 是 核心 。 如 果 你 系统 中 有 System V init 的 话 , 你 可 以 从 中 看 到 如 下 内 容 : 


id:5:initdefault: 


这 表示 运行 级 别 默认 为 5。 
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inittab 中 的 内 容 都 有 如 下 格式 ， 四 列 内 容 使 用 分 号 隔 开 ， 分 别 是 : 
D 唯一 标识 符 (一 串 短 字符 ， 本 例 中 为 id ); 

口 运行 级 别 值 (一 个 或 多 个 ); 

口 init 执 行 的 操作 ( 本 例 中 是 将 运行 级 别 设置 为 5 ); 

口 执行 的 命令 ( 可 选项 )。 

下 面 一 行内 容 告 诉 我 们 命令 如 何 运 行 : 


15:5:wait:/etc/rc.d/rc 5 


这 行内 容 很 重要 ， 它 触发 大 部 分 的 系统 配置 和 服务 。wait 操 作 决 定 System V init 何 时 和 怎样 
运行 命令 。 进 入 运行 级 别 5 时 运行 一 次 /etc/rc.d/rc 5， 然 后 一 直 等 待命 令 执行 完毕 。rc 5 命令 运 
行 /etc/rc5.d 中 所 有 以 数字 开头 的 命令 ( 按 数 字 的 顺序 )。 

除了 initdefault 和 wait 之 外 ， 下 面 是 其 他 inittab 的 常见 操作 。 

respawn 


respawnikinit 在 其 后 的 命令 结束 执行 后 ,再 次 运行 ,在 inittab 文 件 中 你 有 可 能 会 看 到 以 下 内 容 : 


1:2345:respawn:/sbin/mingetty tty1 


getty 程 序 提供 登录 提示 符 。 上 面 的 命令 是 针对 第 一 个 虚拟 控制 台 (/dev/ttyl1 ) 的 ， 当 你 按 
ALT-F1 或 者 CTRL-ALT-F1 时 能 够 看 到 ( 参考 3.4.4 节 )。respawn 在 你 退出 系统 后 重新 显示 登录 提 
示 符 。 

ctrlaltdel 

ctrlaltdel 是 控制 当 你 在 虚拟 控制 台中 按 CTRL-ALT-DEL 键 时 系统 采取 的 操作 。 在 大 部 分 系 
统 中 ， 这 是 重启 命令 ， 它 执行 shutdown 命 令 ( 我 们 将 在 6.7 节 介绍 )。 

sysinit 


sysinit 是 init 在 启动 过 程 中 ， 且 在 进入 运行 级 别 之 前 执行 的 第 一 个 操作 。 


注解 请 在 inittab(5) 帮 助手 册 中 查看 更 多 的 操作 。 


6.6.1 System V init 启 动 命令 顺序 


现在 你 可 以 来 了 解 一 下 ， 在 你 登录 系统 之 前 System V init 是 怎样 启动 系统 服务 的 。 之 前 我 们 
介绍 过 下 列 命令 行 : 


15:5:wait:/etc/rc.d/rc 5 


它 只 是 一 行 简单 的 指令 ,但 实际 触发 了 很 多 其 他 程序 。rc 是 运行 命令 ( run command ) 的 简 
写 ， 我 们 会 在 许多 脚本 、 程 序 和 服务 中 使 用 到 它 。 那 么 运行 的 命令 在 哪里 呢 ? 
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该 行 中 的 5 代表 运行 级 别 5。 运 行 的 命令 多 半 是 在 /etc/rc.d/rc5.d 或 者 /etc/rec5.d 中 。( 运行 级 别 1 
使 用 rcl1.4， 运 行 级 别 2 使 用 rc2.4， 以 此 类 推 。) 你 可 能 会 在 rc5.d 目 录 下 找到 以 下 内 容 : 


910sysklogd S20ppp S99gpm 
S12kerneld S25netstd nfs S99httpd 
Sisnetstd init S30netstd misc S99rmnologin 
Si8netbase S45pcmcia S99sshd 
S20acct S89atd 

9201ogoutd S89cron 


rc 5 命令 通过 执行 下 面 的 命令 来 运行 rc5.d 目 录 下 的 程序 : 


910sysk]logd start 
S12kerneld start 
Sis5netstd init start 
Si8netbase start 

-- Snip-- 

S99sshd start 


请 注意 每 一 行 中 的 start 参 数 。 命 令 名 中 的 大 写 s 表 示 命 令 应 该 在 start 模 式 中 运行 ,数字 00~99 
决定 了 rc 启动 命令 的 顺序 。rc*.d 命 令 通 常 是 命令 行 脚本 ， 用 来 启动 /sbin 或 者 /usr/sbin 中 的 程序 。 
一 般 情况 下 ， 你 可 以 使 用 less 或 其 他 命令 来 查看 脚本 文件 内 容 ， 进 而 了 解 各 种 命令 的 功能 。 


注解 有 一 些 rc*.d 目 录 中 包含 以 K( 代表 kill, 或 者 stop 模 式 ) 开头 的 命令 。 此 时 rc 使 用 参数 stop 
而 非 start 运 行 命 令 。K 开 头 的 命令 通常 在 关闭 系统 的 运行 级 别 中 。 


你 也 可 以 手动 运行 这 些 命令 。 不 过 通常 你 是 通过 init.d 目 录 而 非 rc*.d 来 运行 ,我 们 随后 就 讲 到 。 


6.6.2 ”System V init 链 接 池 


rcx.d 目 录 实 际 上 包含 的 是 符号 链接 ,指向 init.d 目 录 中 的 文件 。 如 果 想 运行 、 添 加、 删除 或 者 
更 改 rc*.d 目 录 中 的 服务 ， 你 需要 了 解 这 些 符号 链接 。 下 面 是 rc5.d 目 录 的 内 容 示 例 : 


lrwxrwxrwx . . . 910sysklogd -> ../init.d/sysklogd 
lrwxrwxrwx . . . S12kerneld -> ../init.d/kerneld 
lrwxrwxrwx . . . Si5netstd init -> ../init.d/netstd init 
lrwxrwxrwx . . . Si8netbase -> ../init.d/netbase 

-- Snip-- 

lrwxrwxrwx . . . S99httpd -> ../init.d/httpd 

-- Snip-- 


像 上 例 所 示 这 样 ， 子 目录 中 所 包含 的 大 量 符 号 链接 ， 我 们 称 之 为 链接 池 (Link Farm )。 有 了 
这 些 链接 ，Linux 可 以 对 不 同 的 运行 级 别 使 用 相同 的 启动 脚本 。 虽 然 不 需要 严格 遵循 ， 但 这 种 方 
法 确实 更 简洁 。 
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启动 和 停止 服务 

如 果 要 手动 启动 和 停止 服务 ， 可 以 使 用 init.d 目 录 中 的 脚本 。 比 如 我 们 可 以 运行 init.d/httpd 
start 来 启动 httpd Web 服 务 。 类 似 地 ， 使 用 stop 参 数 ( 如 httpd stop ) 来 关闭 服务 。 

更 改 启动 顺序 

在 System V init 中 更 改 启 动 顺 序 是 通过 更 改 链接 池 来 完成 的 。 最 常见 的 更 改 是 禁止 init.d 目 录 
中 的 某 个 命令 在 某 个 特定 的 运行 级 别 中 运行 。 在 进行 此 操作 时 需 谨 慎 。 因 为 假如 你 删除 了 某 个 
rc*.d 目 录 中 的 一 个 符号 链接 , 将 来 你 想 恢 复 它 的 时 候 , 你 可 能 已 经 忘记 了 它 的 链接 名 。 所 以 一 个 
比较 好 的 办 法 是 在 链接 名 前 加 下 划 线 (_ )， 如 : 


# mv 599httpd _S99httpd 


这 一 指令 使 得 rc 忽略 _S99httpd， 因 为 文件 名 不 以 $ 或 K 开 头 ， 同 时 又 保留 了 原始 的 链接 名 。 

如 果 要 添加 服务 , 我 们 可 以 在 init.d 目 录 中 创建 一 个 脚本 文件 , 然后 在 相应 的 rc*.d 目 录 中 创建 
指向 它 的 符号 链接 。 最 简单 的 办 法 是 在 init.d 目 录 中 复制 和 修改 你 熟悉 的 脚本 ( 更 多 命令 行 脚本 的 
内 容 参 见 第 11 章 )。 

在 添加 服务 的 时 候 ， 需 要 为 其 设置 适当 的 启动 顺序 。 如 果 服 务 启动 过 早 ， 可 能 会 导致 失败 ， 
因为 它 依赖 的 其 他 服务 可 能 还 没有 就 绪 。 对 于 那些 不 重要 的 服务 , 大 多 数 系统 管理 员 会 为 它们 设 
置 90 以 后 的 序号 ， 以 便 让 系统 服务 首先 启动 。 


6.6.3 run-parts 


System V init 运 行 init.d 脚 本 的 机 制 在 很 多 Linux 系 统 中 被 广泛 应 用 ,其 至 包括 那些 没有 System 
V init 的 系统 。 其 中 有 一 个 工具 我 们 称 为 run-parts， 它 能 够 按照 特定 顺序 运行 指定 目录 中 的 所 有 
可 执行 程序 。 这 好 比 是 用 户 使 用 1s 命 令 列 出 目录 中 的 程序 ， 然 后 逐一 运行 。 

run-parts 默 认 运 行 目录 中 的 所 有 可 执行 程序 ， 也 有 可 选项 用 来 指定 执行 或 忽略 某 些 特定 程 
序 。 在 一 些 Linux 系 统 中 ， 你 不 太 需 要 控制 这 些 程序 如 何 运行 。 如 Fedora 就 只 包含 一 个 很 简单 的 
run-parts 版 本 。 

其 他 一 些 Linux 系 统 ， 如 Debian 和 Ubuntu 则 包含 一 个 复杂 一 些 的 run-parts 程 序 。 其 功能 包括 
使 用 正则 表达 式 来 选择 运行 程序 ( 例如, 使 用 s[0-9]{2} 来 运行 /etc/init.d 运 行 级别 目 录 中 的 所 有 启 
动 脚本 )， 并 且 还 能 够 向 这 些 程序 传递 参数 。 这 些 特 性 能 够 让 我 们 使 用 一 条 简单 的 命令 来 完成 
System V 运 行 级 别 的 启动 和 停止 。 

关于 run-parts 的 细节 你 不 需要 知道 太 多 ,很 多 人 其 至 不 知道 有 run-parts 这 人 么 个 东西 。 你 只 
需要 知道 它 能 够 运行 一 个 目录 中 的 所 有 程序 ， 在 脚本 中 时 不 时 会 出 现 即 可 。 


6.6.4 System V init 控 制 


有 些 时 候 ， 你 需要 手动 干预 一 下 init， 以 便 它 能 够 切换 运行 级 别 ， 或 者 重新 加 载 配置 信息 ， 
甚至 关闭 系统 。 你 可 以 使 用 telinit 来 操纵 System V init。 例 如 ， 使 用 以 下 命令 切换 到 运行 级 别 3 : 
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# telinit 3 


运行 级 别 切换 时 ，init 会 试图 终止 所 有 新 运行 级 别 的 inittab 文 件 中 没有 包括 的 进程 ， 所 以 需要 
小 心 操作 。 

如 果 你 需要 添加 或 者 删除 任务 ， 或 者 更 改 inittab 文 件 ， 你 需要 使 用 telinit 命 令 让 init 重 新 加 
载 配置 信息 ， 


# telinit q 


可 以 使 用 telinit s 命 令 切换 到 单 用 户 模式 〈 见 6.9 节 )。 


6.7 关闭 系统 


init 控 制 系统 的 启动 和 关闭 。 关闭 系 统 的 命令 在 所 有 init 版 本 中 都 是 一 样 的 。 关 闭 Linux 系 统 最 
好 的 方式 是 使 用 shutdown 命 令 。 

shutdown 命 令 有 两 种 使 用 方法 ， 一 是 使 用 -h 可 选项 关闭 系统 ， 并 且 使 其 一 直 保 持 关闭 状态 。 
下 面 的 命令 能 够 立即 关闭 系统 : 


# shutdown -h now 


在 大 部 分 系统 中 ，-h 代 表 切 断 机 带电 源 。 男 外 还 可 以 使 用 -r 来 重启 系统 。 

系统 的 关闭 过 程 会 持续 几 秒 钟 ， 在 此 过 程 中 请 不 要 重 置 或 切断 电源 。 

上 例 中 的 now 是 时 间 ， 是 一 个 必须 的 参数 。 设 置 时 间 的 方法 有 很 多 种 。 例 如 ， 如 果 你 想 让 系 
统 在 将 来 某 一 时 间 关 闭 ， 可 以 使 用 tn。n 以 分 钟 为 单位 ， 系 统 会 在 n 分 钟 后 执行 关闭 命令 。( 可 以 
在 shutdown(8) 帮 助手 册 中 查看 更 多 相关 选项 。) 

下 面 的 命令 在 10 分 钟 后 重启 系统 : 


# shutdown -r +10 


Linux 会 在 shutdown 运 行 时 通知 已 经 登录 系统 的 用 户 ， 不 过 也 仅 此 而 已 。 如 果 你 将 时 间 参 数 
设置 为 now 以 外 的 值 ，shutdown 命 令 会 创建 一 个 文件 /etc/nologin。 这 个 文件 存在 时 ， 系统 会 禁止 超 
级 用 户外 的 任何 用 户 登录 。 

系统 关闭 时 间 到 时 ，shutdown 命 令 通 知 init 开 始 关闭 进程 。 在 Systemd 中 ， 这 意味 着 激活 关闭 
单元 ; 在 Upstart 中 ， 这 意味 着 产生 关闭 事件 ; 在 System V init 中 ， 这 意味 着 将 运行 级 别 设 置 为 0 或 
6。 无 论 哪个 系统 ， 关 闭 过 程 都 大 致 如 下 所 示 。 

(1) init 通 知 所 有 进程 安全 关闭 。 

(2) 如 果 某 个 进程 没有 及 时 响应 ，init 会 先 使 用 TERM 信和 号 尝试 强行 终止 它 。 

(3) 如 果 TERM 信 号 无 效 ，init 会 使 用 KILL 信 号。 

(4) 锁定 系统 文件 ， 并 且 进 行 其 他 关闭 准备 工作 。 
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(5) 系统 仓 载 root 以 外 的 所 有 文件 系统 。 

(6) 系统 以 只 读 模 式 重 新 挂 载 root 文 件 系统 。 

(7) 系统 将 所 有 缓冲 区 中 的 数据 通过 sync 程 序 写 到 文件 系统 。 

(8) 最 后 一 步 是 使 用 reboot(2) 系 统 调用 通知 内 核 重 启 或 者 停止 。 这 一 步骤 是 由 init 或 者 其 他 辅 
助 程序 如 reboot 、halt 或 者 poweroff 来 完成 。 

repoot 和 halt 程 序 因 它 们 被 调用 的 方式 不 同 而 行为 各 异 ， 有 时 还 会 带 来 一 些 困 扰 。 默 认 情 况 
下 ， 它 们 使 用 参数 -xz 或 者 -h 来 调用 shutdown。 但 如 果 系 统 已 经 处 于 halt 或 者 reboot 的 运行 级 别 ， 则 
程序 会 通知 内 核 立即 关闭 自己 。 如 果 你 想 不 计 后 果 快 速 关闭 系统 ， 可 以 使 用 -f (force ) 选项 。 


6.8 initramfs 


Linux 启 动 过 程 很 简单 。 但 是 其 中 的 一 个 组 件 总 是 让 人 一 头 雾 水 , 那 就 是 initramfs ， 或 称 为 初 
始 RAM 文 件 系 统 。 可 以 把 它 看 作 是 一 个 用 户 空 间 的 模子 ， 在 用 户 空间 启动 前 出 现 。 不 过 首先 我 
们 来 看 看 它 是 用 来 做 什么 的 。 

问题 还 得 从 种 类 各 异 的 存储 硬件 说 起 。 不 知道 你 是 否 还 记得 ，Linux 内 核 从 磁盘 读 取 数 据 时 
不 直接 与 BIOS 和 EFI 接 口 通信 。 为 了 挂 载 root 文 件 系统 ， 它 需要 底层 的 驱动 程序 支持 。 如 果 root 
文件 系统 存放 在 一 个 连接 到 第 三 方 控制 器 的 磁盘 阵列 (RAID ) 上 ， 内 核 首 先 就 需要 这 个 控制 器 
的 驱动 程序 。 因 为 存储 控制 需 的 驱动 程序 种 类 繁多 ,内核 不 可 能 把 它们 都 包含 进来 ,所 以 很 多 驱 
动 程序 都 以 可 加 载 模块 的 方式 出 现 。 可 加 载 模块 是 以 文件 形式 来 存放 ,如果 内 核 一 开始 没有 挂 载 
文件 系统 的 话 ， 它 就 无 法 加 载 需要 的 这 些 驱动 模块 了 。 

解决 的 办 法 是 将 一 小 部 分 内 核 驱动 模块 和 工具 打包 为 一 个 文档 。 引导 装载 程序 在 内 核 运行 前 
将 该 文档 载 人 内 存 。 内 核 在 启动 时 将 文档 内 容 读 人 一 个 临时 的 initramfs ， 然 后 挂 载 到 /上 ， 将 用 户 
模式 切换 给 initramfs 上 的 init， 然 后 使 用 initramfs 中 的 工具 让 内 核 加 载 root 文 件 系统 需要 的 驱动 模 
块 。 最 后 ， 这 些 工 具 挂 载 真正 的 root 文 件 系统 ， 启 动 真 正 的 init。 

initramfs 的 具体 实现 各 有 不 同 ， 并 且 还 在 不 断 演 进 。 在 一 些 系统 中 ，initramfs 的 init 就 是 一 个 
简单 的 命令 行 脚本 ， 通 过 udevd 来 加 载 启动 程序 ， 然 后 挂 载 真正 的 root 并 在 其 上 执行 init。 在 使 用 
systemd 的 系统 中 ， 你 能 在 其 中 看 到 整个 的 systemd 安 装 ， 但 没有 单元 配置 文件 ， 只 有 一 些 udevd 
配置 文件 。 

initramfs 的 一 个 始终 未 变 的 特性 是 你 可 以 在 不 需要 时 跳 过 它 。 也 就 是 说 ， 如 果 内 核 已 经 有 了 
所 有 它 需 要 的 用 来 挂 载 根 文件 系统 的 驱动 程序 ， 你 就 可 以 在 你 的 引导 装载 程序 配置 中 跳 过 
initramfs 。 跳 过 该 过 程 能 够 缩短 几 秒 钟 的 启动 时 间 。 你 可 以 自己 尝试 在 GRUB 菜 单 编辑 器 中 删除 
initrd 行 。( 最 好 不 要 使 用 GRUB 配 置 文件 来 做 实验 ， 一 旦 出 错 很 难 恢复 。) 目前 来 说 ，initramfs 
还 是 需要 的 ， 因 为 大 多 数 的 Linux 内 核 并 不 包含 诸如 通过 UUID 挂 载 这 些 特性 。 

initramfs 只 是 通过 gzip 压 缩 的 cpio 归 档 文件 ( 见 帮 助手 册 cpio(1) )。 你 可 以 先 从 引导 装载 程序 
配置 中 找到 该 文件 (例如 使 用 grep 在 grub.cfg 文 件 中 查找 initrd )， 然 后 使 用 cpio 将 归档 文件 的 内 
容 释放 到 一 个 临时 目录 来 查看 其 内 容 ， 如 下 例 所 示 : 
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$ mkdir /tmp/myinitrd 

$ cd /tmp/myinitrd 

$ zcat /boot/initrd.img-3.2.0-34 | cpio -i --no-absolute-filenames 
-- Snip-- 


其 中 有 一 处 地 方 值得 一 提 ， 就 是 init 未 尾 的 “pivot” 部 分 。 它 负责 清除 临时 文件 系统 中 的 内 
容 ， 以 节省 内 存 空 间 并 切换 到 真正 的 root。 

创建 initramfs 的 过 程 很 复杂 ， 不 过 通常 我 们 不 需要 自己 动手 。 有 很 多 工具 可 以 供 我 们 使 用 ， 
Linux 系 统 中 通常 都 会 自 带 ， 如 dracut 和 mkinitramfs 是 最 为 常用 的 两 个 。 


注解 initramfs 是 指使 用 cpio 归 档 文件 作为 临时 文件 系统 。 它 的 一 个 较 老 的 版 本 叫 作 initrd ( 即 
初始 RAM 磁 盘 ), 它 使 用 磁盘 映像 文件 作为 临时 文件 系统 cpio 归档 文 件 的 维护 更 加 简单 ， 
不 过 很 多 时 候 initrd 也 用 来 代 指 使 用 cpio 的 initramfs。 如 上 例 所 示 ，, 文件 名 和 配置 文件 中 
都 仍然 包含 initrd。 


6.9 ”紧急 启动 和 单 用 户 模 式 


当 系 统 出 现 问题 时 ， 首 先 采取 的 措施 通常 是 使 用 系统 安装 映像 来 启动 系统 ， 或 者 使 用 
SystemRescueCd 这 样 可 以 保存 到 移动 存储 设备 上 的 恢复 映像 。 系 统 修复 的 任务 大 致 包括 以 下 几 
方面 : 

口 系统 崩溃 后 ， 检 查 文 件 系统 ; 

口 重 置 系统 管理 员 密码 ; 

口 修复 关键 的 系统 文件 ， 如 /etc/fstab 和 /etc/passwd; 
口 系统 崩 演 后 ， 借 助 备份 数据 恢复 系统 。 

除 上 述 措施 外 , 快速 启动 的 男 一 个 可 选 途径 是 启用 单 用 户 模式 。 它 将 系统 启动 到 root 命 令 行 ， 
而 不 是 完整 启动 所 有 的 服务 。 在 System V init 中 ， 运 行 级 别 1 通常 是 单 用 户 模式 。 你 也 可 以 在 引导 
装载 程序 中 使 用 -s 参 数 来 进入 此 模式 ， 只 不 过 可 能 需要 输入 root 密 码 。 

单 用 户 模式 的 最 大 问题 是 它 提供 的 服务 有 限 ， 如 网 络 、 图 形 界面 和 终端 通常 都 不 可 用 。 所 以 
我 们 在 系统 恢复 时 通常 优先 考虑 系统 安装 映像 。 
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当 你 第 一 次 看 到 /etc 目 录 时 ， 可 能 会 感觉 信息 量 太 大 。 
然 , 其 中 的 大 多 数 文件 或 多 或 少 都 对 系统 运行 有 影响 , 但 
只 有 少数 文件 起 非常 关键 的 作用 。 


口 “ 寺 


本 章 我 们 介绍 一 些 系 统 组 件 ， 它 们 使 得 用 户 级 工具 ( 参见 第 2 章 ) 能 够 访问 系统 的 基础 设施 
(参见 第 4 章 )。 我 们 将 着 重 介绍 以 下 内 容 : 
口 系统 库 为 获得 服务 和 用 户 信 息 而 访问 的 配置 文件 ; 
口 系统 启动 时 运行 的 服务 程序 ( 有 时 称 为 守护 进程 ); 
口 用 来 更 改 服务 程序 和 配置 文件 的 配置 工具 ; 
口 系统 管理 工具 。 
本 章 不 涉及 网 络 相 关 的 内 容 ， 因 为 那 是 一 个 相对 独立 的 部 分 ， 我 们 将 在 第 9 章 介绍 。 


7.1 /etc 目录 结构 


Linux 系 统 的 大 部 分 系统 配置 文件 都 存放 在 /etc 目 录 中 。 按 照 惯例 ， 每 个 程序 在 这 里 都 有 一 个 
或 多 个 配置 文件 。 因 为 Unix 系 统 的 程序 数目 很 多 ， 所 以 /etc 目 录 也 会 越 来 越 庞大 。 

这 样 带 来 了 两 个 问题 : 不 仅 很 难 找到 要 找 的 配置 文件 ， 而 且 维 护 起 来 也 不 方便 。 比 如 ， 要 更 
改 系统 的 日 志 配 置 ， 你 需要 编辑 /etc/syslog.conf 文 件 。 但 是 你 的 更 改 可 能 会 被 随后 的 系统 升级 覆 
盖 掉 。 

目前 比较 常见 的 方式 是 将 系统 配置 文件 放 到 /etc 下 的 子 目 录 ， 像 我 们 介绍 过 的 启动 目录 一 样 
( Upstart 的 是 /etc/init，systemd 的 是 /etc/systemd )。 虽 然 /etc 目 录 下 仍然 会 有 一 些 零散 的 配置 文件 ， 
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如 果 你 运行 1s -F /etc 查 看 的 话 ， 你 会 发 现 大 部 分 配置 文件 都 放 到 了 子 目 录 中 。 

为 了 解决 配置 文件 被 覆盖 的 问题 ， 你 可 以 将 定制 的 配置 放 到 子 目 录 里 的 其 他 文件 中 ， 如 
/etc/grub.d。 

/etc 中 到 底 有 哪些 类 型 的 配置 文件 呢 ? 基本 规律 是 针对 系统 的 可 定制 的 配置 文件 在 /etc 下 ,如 
用 户 信息 ( /etc/passwd ) 和 网 络 配置 ( /etc/network )。 然 而 ， 与 应 用 程序 细节 相关 的 文件 不 在 /etc 
中 ,如 系统 用 户 界面 的 默认 配置 。 你 会 发 现 那 些 不 可 定制 的 系统 配置 文件 存放 在 了 其 他 地 方 ， 比 
如 预先 打包 的 系统 单元 文件 在 /usr/lib/systemd 中 。 

我 们 已 经 介绍 过 一 些 启动 相关 的 配置 文件 。 下 面 让 我 们 来 看 一 个 具体 的 系统 服务 及 其 配置 
文件 。 


7.2 ”系统 日 志 


大 多 数 系统 程序 将 它们 的 日 志 信 息 输出 到 syslog 服 务 。 传统 的 syslogd 守 护 进 程 等 待 消息 的 到 
来 ， 并 根据 它们 的 类 型 将 它们 输出 到 文件 、 屏 幕 、 用 户 或 其 他 地 方 ， 有 的 干脆 忽略 。 


7.2.1 系统 日 志 


系统 日 志 是 系统 中 最 重要 的 部 分 之 一 。 如 果 系 统 出 现 你 不 清楚 的 错误 , 查看 系统 日 志文 件 是 
第 一 选择 。 以 下 是 日 志文 件 示 例 : 


Aug 19 17:59:48 duplex sshd[484]: Server listening on 0.0.0.0 port 22. 


大 多 数 Linux 系 统 使 用 的 是 syslogd 的 一 个 新 版 本 ， 叫 作 rsyslogd。 它 的 功能 不 仅仅 限于 记录 
志 信 息 。 比 如 ,你 还 可 以 让 它 加 载 一 个 将 日 志 信息 写 到 数据 库 的 模块 。 不 过 最 简单 的 方式 还 是 
从 /varlog 目 录 开 始 。 你 看 看 其 中 的 那些 日 志文 件 后 ， 就 能 够 了 解 它 们 来 自 哪 里 。 
/var/log 目 录 中 很 多 文件 都 不 是 由 系统 日 志 来 维护 的 。 要 知道 哪些 日 志 属 于 rsyslogd, 需要 查 
看 它们 的 配置 文件 。 


7.2.2 ”配置 文件 


rsyslog 的 基础 配置 文件 是 /etc/rsyslog.conf， 但 你 还 会 在 其 他 地 方 ( 如 /etc/rsyslog.d ) 发 现 另 
外 一 些 配置 文件 。 其 内 容 包含 传 统 的 规则 和 Tsyslog 扩 展 。 其 中 一 条 规则 是 任何 以 字符 $ 开 头 的 都 
是 扩展 。 

传统 的 规则 包括 一 个 选择 符 ( selector ) 和 一 个 操作 (action )， 分 别 代 表 从 哪里 获得 日 志和 将 
它们 写 到 哪里 ， 如 下 例 所 示 : 


例 7-1 syslog 规 则 


kern.* /dev/console 
*.info;authpriv.noneO /var/log/messages 
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authpriv.* /var/log/secure, root 
mail.* /var/log/maillog 
cron.* /var/log/cron 
*.emerg *@ 

local7.* /var/log/boot.1og 


左边 是 选择 符 , 表示 要 为 哪 种 信息 类 型 记录 日 志 。 右边 是 操作 列表 , 表示 要 将 日 志 写 到 哪里 。 
例 7-1 中 大 部 分 的 操作 都 是 将 日 志 写 人 文件 , 也 有 一 些 例外 。 例 如 : /dev/console 表 示 系 统 控制 台 
的 一 个 特殊 设备 ，root 表 示 如 果 root 用 户 登录 的 话 , 将 消息 发 送 给 他 ，* 代 表 发 送 消息 给 系统 中 的 
所 有 用 户 。 你 还 可 以 使 用 @host 将 消息 发 送 给 网 络 上 的 其 他 主机 。 

设施 和 优先 级 

选择 符 用 来 匹配 日 志 信 息 的 设施 和 优先 级 。 设 施 是 指 消息 的 大 致 分 类 。( 在 rsyslog.conf(5) 帮 
助手 册 中 查看 完整 的 设施 列表 。) 

设施 的 功能 很 容易 通过 它们 的 名 称 得 知 。 例如 , 例 7-1 中 的 配置 文件 从 kern、authpriv、mail、 
cron 和 1local7 这 些 设施 中 抓 取 日 志 信 息 。@ 处 的 * 号 是 一 个 通配符 ,表示 从 所 有 设施 中 获得 输出 。 

设施 后 的 点 号 (.) 后 面 是 优先 级 ， 由 低 到 高 分 别 是 : debug、info、notice、warning、err、 
crit 、alert 或 emerge。 


注解 ”要 在 rsyslog.conf 中 将 日 志 消 息 从 设施 中 排除 ， 可 以 使 用 none 作 为 优先 级 ， 如 例 7-1 中 @ 
所 示 。 


为 选择 符 设 置 了 优先 级 之 后 ，rsyslogd 将 该 优先 级 及 其 以 上 优先 级 的 消息 发 送 到 指定 目的 
地 。 也 就 是 说 , 例 7-1 中 人 @ 处 的 *.info 将 抓 取 大 部 分 日 志 消 息 并 将 它们 写 到 /var/log/messages， 因 为 
info 是 一 个 相对 较 低 的 优先 级 。 

扩展 语法 

之 前 提 到 过 ，rsyslogd 的 语法 扩展 了 传统 的 syslogd 语 法 ， 它 们 通常 以 $ 开 头 ， 我 们 称 之 为 指 
令 。 一 个 比较 常用 的 扩展 是 让 你 加 载 其 他 的 配置 文件 。rsyslog.conf 中 就 包含 这 样 的 指令 ， 让 
rsyslogd 加 载 /etc/rsyslog.d 目 录 中 的 所 有 .conf 文 件 。 


$IncludeConfig /etc/rsyslog.d/*.conf 


大 部 分 的 指令 都 很 好 理解 ， 比 如 以 下 涉及 用 户 和 权限 的 指令 : 


$FileOwner syslog 
$FileGroup adm 
$FileCreateMode 0640 
$DirCreateMode 0755 
$Umask 0022 
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注解 ”还 有 一 些 rsyslogd 配 置 文件 扩展 定义 了 输出 模板 和 频道 ， 你 可 以 查看 rsyslogd(5) 完 整 的 玫 
助手 册 ， 不 过 它 的 Web 文 档 更 全 面 一 些 。 


故障 排除 
测试 系统 日 志 最 简单 的 方法 之 一 是 使 用 logger 命 令 手动 发 送 日 志 消 息 ， 如 下 所 示 : 


$ logger -p daemon.info something bad just happened 


rsyslogd 不 容易 出 错 。 出 现 问题 大 都 是 因为 配置 文件 没有 正确 配置 设施 或 优先 级 ， 因 而 没有 
获得 想 要 抓 取 的 日 志 信息 ， 或 者 是 由 于 磁盘 空间 不 足 。 大 多 数 系 统 会 使 用 logrotate 或 者 类 似 工 
具 来 自动 清 除 Narlog 中 的 文件 ， 不 过 如 果 在 短 时 间 写 入 大 量 日 志 , 还 是 会 出 现 系统 负载 增加 、 磁 
盘 空 间 用 尽 的 情况 。 


注解 rsyslogd 抓 取 的 日 志 不 仅仅 来 自 于 系统 各 组 件 , 我 们 在 第 6 章 介 绍 i 
的 启动 日 志 消 息 ， 除 此 之 外 还 有 很 多 其 他 来 源 ， 比 如 Apache Web 服 务 器 ， 通 常 它 有 自己 
的 0 上 日志 。 你 可 以 查看 服务 器 配置 来 获得 那些 日 志 。 


日 志 的 过 去 和 未 来 

syslog 服 务 在 不 断 演进 。 曾 经 出 现 过 一 个 叫 klogd 的 守护 进程 ， 负 责 为 syslogd 截 获 内 核 的 日 
志 消 息 ， 这 些 日 志 可 以 使 用 dmesg 命 命令 查看 。 后 来 该 功能 被 并 人 到 了 rsyslogd 中 。 

组 良 置 疑 的 是 ，Linux 的 系统 日 志 功 能 会 随 着 时 间 而 改变 。Unix 系 统 日 志 从 来 就 没有 形成 过 
真正 的 标准 ， 不 过 这 种 情况 正在 慢 慢 改变 。 


7.3 ”用户 管 理 文 件 


Jnix 系 统 支 持 多 用 户 。 用 户 对 于 内 核 而 言 只 是 一 些 数 字 (用 户 ID )， 因 为 用 户 名 比 数字 容易 
记忆 ， 所 以 用 户 一 般 都 是 用 用 户 名 (或 登录 名 ) 而 非 用 户 ID 来 管理 系统 。 用 户 名 只 存在 于 用 户 空 
间 ， 使 用 到 用 户 名 的 应 用 程序 在 和 内 核 通信 时 ， 通 常 需要 将 用 户 名 映射 为 用 户 ID。 


四 


7.3.1 /etc/passwd 文 件 
文本 文件 /etc/passwd 中 包含 一 一 对 应 的 用 户 名 和 用 户 ID。 如 下 所 示 : 
例 7-2 /etc/passwd 中 的 用 户 列表 


root:x:0:0:Superuser:/root:/bin/sh 
daemon:*:1:1:daemon:/usr/sbin:/bin/sh 
bin:*:2:2:bin:/bin:/bin/sh 
Sys:*:3:3:sys:/dev:/bin/sh 
nobody:*:65534:65534:nobody:/home:/bin/false 
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juser:x:3119:1000:]. Random User:/home/juser:/bin/bash 
beazley:x:143:1000:David Beazley:/home/beazley:/bin/bash 


每 一 行 代表 一 个 用 户 ， 一 共有 7 列 ， 用 冒号 :分 隔 。 这 7 列 所 代表 的 内 容 如 下 所 示 。 

口 登录 名 。 

口 经 过 加 密 的 用 户 密码 。 大 部 分 Linux 系 统 都 不 在 passwd 文 件 中 存放 实际 的 用 户 密码 ， 而 是 
将 密码 存放 在 shadow 文 件 中 ( 见 7.3.3 节 )。shadow 文 件 的 格式 和 passwd 类 似 ， 不 过 普通 用 
户 没 有 访问 权限 。passwd 和 shadow 文 件 中 的 第 2 列 是 经 过 加 密 的 密码 ， 是 一 些 像 
d1CVEWiB/oppc 这 样 的 字符 ， 读 起 来 很 费劲 。( Unix 从 不 明文 存储 密码 。) 

第 2 列 中 的 x 代表 加 密 过 的 密码 存放 在 shadow 文 件 中 。* 代 表 用 户 不 能 登录 , 如 果 为 空 ( 像 :: 
这 样 )， 则 表示 登录 不 需要 密码 。( 绝对 不 要 将 普通 用 户 的 该 列 设置 为 空 。) 

口 用 户 IDP。 它 是 用 户 在 内 核 中 的 标识 。 同 一 个 用 户 ID 可 以 出 现在 两 行 中 ， 不 过 这 样 做 比较 

容易 产生 混淆 ， 程 序 在 处 理 时 也 需要 将 它们 合并 起 来 。 用 户 ID 必须 唯一 。 

口 用 户 组 ID。 它 是 /etc/group 文 件 中 的 某 个 ID 号 。 用 户 组 定义 了 文件 权限 及 其 他 。 该 列 也 称 

为 用 户 的 基本 组 。 

口 用 户 的 真实 名 称 (通常 称 为 GECOS 列 )。 有 时 候 其 中 会 有 逗号 , 用 来 分 隔 房间 和 电话 号 码 。 

口 用 户 的 root 目 录 。 

口 用 户 使 用 的 命令 行 ， 即 用 户 运 行 终端 的 程序 。 

图 7-1 标 识 出 了 例 7-2 中 条 目的 各 列 。 


Login name 
0 


User| 
ee Real name (GECOS) 
Home directory 
r Shell 


juser:x:3119:1000:]， a User: /home/juser:/bin/bash 
图 7-1 passwd 文 件 中 的 条 目 
/etc/passwd 文 件 有 严格 的 语法 规则 ， 不 允许 注释 和 空 行 。 


注解 ”用 户 在 /etc/passwd 中 的 对 应 行 及 其 root 目 录 统 称 为 用 户 账号 。 


7.3.2 ”特殊 用 户 


在 /etc/passwd 中 有 一 些 特殊 用 户 。 其 中 , 超级 用 户 的 UID 和 GID 固 定 为 0， 如 例 7-2 所 示 。 有 一 
些 用 户 如 守护 进程 用 户 没有 登录 权限 .nobody 用 户 的 权限 最 小 。 一 些 进程 在 nobody 用 户 名 下 运行 ， 
因为 它 没有 任何 写 入 权限 。 

无 法 登录 的 用 户 我 们 称 为 伪 用 户 。 虽然 无 法 登录 系统 , 但 是 系统 可 以 使 用 它们 来 运行 一 些 进 
程 。 创 建 像 nobody 用 户 这 样 的 伪 用 户 ， 目 的 是 为 了 安全 考虑 。 


图 灵 社 区 会 员 小 虎 (164142021@qq.com) 专 享 尊重 版 权 


124 第 7 章 系统 配置 : 上 日志、 系统 时 间 、 批 处 理 任 务 和 用 户 


7.3.3 /etc/shadow 文 件 


Linux 中 的 影子 密码 文件 ( /etc/shadow ) 包含 用 户 验 证 信息 以 及 经 过 加 密 的 密码 和 密码 过 期 日 
期 这些 都 和 /etc/passwd 文 件 中 的 用 户 相 对 应 。 

影子 文件 为 密码 存储 提供 了 一 种 更 灵活 (同时 也 更 安全 ) 的 方法 。 它 包括 了 一 些 程序 库 和 工 
具 ， 后 来 很 快 被 PAM 替 代 (参考 7.10 节 )。PAM 并 没有 为 Linux 引 进 一 套 全 新 的 文件 ， 而 是 使 用 
/etc/shadow 文 件 ， 但 像 /etc/login.defs 这 样 对 应 的 配置 文件 并 不 使 用 它 。 


7.3.4 用 户 和 密码 管理 


普通 用 户 使 用 passwd 命 令 来 更 改 密码 。 默 认 状 态 下 ，passwd 可 以 更 改 用 户 密码 ， 但 你 还 可 以 
使 用 -f 选 项 来 更 改 用 户 名 ， 用 -s 选 项 来 更 改 shell ( /etc/shells 中 有 shell 列 表 )。( 你 还 可 以 使 用 chfn 
和 chsh 来 更 改 用 户 名 和 shell。)passwd 命 令 是 一 个 suid-root 程 序 , 只 有 超级 用 户 能 够 编辑 /etc/passwd 
文件 。 

使 用 超级 用 户 来 更 改 /etc/passwd 

由 于 /etc/passwd 是 纯 文 本 文件 ， 因 此 超级 用 户 可 以 使 用 任何 文本 编辑 器 来 编辑 它 。 要 添加 用 
户 ， 只 需 加 上 恰当 的 命令 行 并 为 用 户 创建 一 个 root 目 录 即 可 。 要 删除 用 户 则 反之 。 不 过 通常 我 们 
使 用 vipw 来 编辑 /etc/passwd 文 件 , 它 更 为 安全 , 会 在 你 编辑 时 备份 和 锁定 文件 。 你 还 可 以 使 用 vipw 
-s 来 编辑 /etc/shadow 文 件 (但 你 可 能 永远 不 需要 用 到 )。 

很 多 人 不 愿意 直接 编辑 passwd 文 件 ， 因 为 很 容易 把 文件 搞 乱 。 使 用 男 外 的 终端 命令 或 者 GUI 
会 更 为 方便 和 安全 。 比如, 可 以 使 用 超级 用 户 运 行 passwd user 来 设置 用 户 密 码 。adduser 和 和 userdel 
可 以 添加 和 删除 用 户 。 


7.3.5 用 户 组 


用 户 组 可 以 将 文件 访问 权 设 定 给 某 些 用 户 ,， 而 使 其 他 用 户 无 权 访问 。 你 可 以 为 某 组 用 户 设置 
读 写 位 ， 从 而 排除 其 他 的 用 户 。 在 多 名 用 户 共享 一 台 主 机 的 时 候 ， 用户 组 很 有 用 。 然 而 现在 我 们 
很 少 在 主机 上 共享 文件 了 。 

/etc/group 文 件 中 包含 了 用 户 组 ID ( 类 似 /etc/passwd 文 件 中 的 ID )， 如 例 7-3 所 示 。 


例 7-3 /etc/group 文 件 样 例 


root:*:0:juser 
daemon:*:1: 

bin:*:2: 

SyS:*:3: 

adm:*:4: 
disk:*:6:juser,beazley 
nogroup:*:65534: 
User:*:;1000: 
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和 /etc/passwd 文 件 一 样 ，/etc/group 中 的 每 一 行 有 多 列 ， 由 冒号 分 隔 。 每 一 列 所 代表 的 内 容 如 
下 所 示 。 
口 用 户 组 名 : 运行 如 1s -1 这 样 的 命令 时 可 以 看 到 。 
口 用 户 组 密码 : 很 少 也 不 该 被 使 用 (使 用 sudo 替 代 )。 可 以 设置 为 * 或 者 其 他 默认 值 。 
口 用 户 组 DD: 必须 是 一 个 唯一 的 数字 。 用 户 组 ID 出 现在 /etc/passwd 文 件 的 用 户 组 列 中 。 
口 属于 该 组 的 用 户 列表 : 该 列 是 可 选项 ，passwd 文 件 中 的 用 户 组 ID 列 也 定义 了 用 户 属于 哪 


个 用 户 组 。 
图 7-2 显 示 了 用 户 组 文件 中 的 各 列 : 
Group name 
Password 
Group ID 


Additional members 


disk:*:6:juser,beazley 
图 7-2 group 文件 中 的 条 目 
你 可 以 使 用 group 命 令 来 查看 你 所 属 的 用 户 组 。 


注解 ”Linux 通常 会 为 每 个 新 加 入 的 用 户 创建 一 个 新 的 用 户 组 ， 用 户 组 名 和 用 户 名 相同 。 


7.4 getty 和 login 


getty 连 接 到 终端 并 且 在 其 上 显示 登录 提示 符 。 大 多 数 Linux 系 统 中 的 getty 程 序 很 简单 , 仅仅 
是 在 虚拟 终端 上 显示 登录 提示 符 。 它 可 以 用 在 管道 命令 中 ， 如 下 所 示 : 


$ ps ao args | grep getty 
/sbin/getty 38400 tty1 


本 例 中 ，38400 是 波 特 率 。 有 些 getty 不 需要 该 设置 。( 虚拟 终端 会 忽略 此 设置 ， 这 只 是 为 了 
和 连接 串 行 口 的 那些 程序 兼容 。) 

输入 用 户 名 后 ，getty 调 用 login 程 序 提示 你 输入 密码 。 如 果 输 入 的 密码 正确 ，login 会 调用 你 
的 shell ( 使 用 exec() )。 否 则 你 会 得 到 “登录 错误 ”提示 信息 。 

现在 你 了 解 了 getty 和 login, 但 你 可 能 永远 都 不 需要 配置 和 更 改 它们 。 实 际 上 ， 你 使 用 它们 
的 机 会 可 能 不 多 ， 因 为 现在 用 户 大 都 通过 图 形 界面 ( 如 gdm ) 或 者 远程 登录 ( 如 SSH )， 这 些 都 用 
不 着 getty 和 1login。 登 录 程 序 的 实际 验证 工作 大 多 是 由 PAM 来 完成 的 (参考 7.10 节 )。 


7.5 设置 时 间 
Unix 系 统 的 运行 依赖 精确 的 计时 , 而 内 核 则 负责 维护 系统 时 钟 。 你 可 以 使 用 date 命 令 来 查看 ， 
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还 可 以 用 它 设置 时 间 , 不 过 并 不 推荐 这 样 做 ， 因 为 设置 的 时 间 有 可 能 不 精准 ， 而 你 的 系统 时 间 应 
该 尽 可 能 精准 。 

计算 机 硬件 有 一 个 使 用 电池 的 实时 时 钟 (Real-time Clock， 以 下 简称 RTC )。RTC 并 不 是 最 精 
准 的 ， 但 是 聊 胜 于 无 。 内 核 通 常 在 启动 时 使 用 RTC 来 设置 时 间 。 你 可 以 使 用 hwclock 命 令 将 系统 
时 间 重 新 设置 为 硬件 系统 的 当前 时 间 。 最 好 将 你 的 硬件 时 钟 设置 为 通用 协调 时 间 ( Universal 
Coordinated Time， 以 下 简称 UTC )， 这 样 可 以 避免 不 同时 区 和 夏令 时 带 来 的 问题 。 你 可 以 使 用 以 
下 命令 将 内 核 的 UTC 时 钟 设 置 为 RTC 


# hwclock --hctosys --utc 


不 过 内 核 在 计时 方面 还 不 如 RTC， 因 为 Unix 系 统 启 动 一 次 经 常 持续 运行 数 月 甚至 数 年 ， 所 以 
容易 产生 时 间 误 差 ( time drift )。 这 个 误差 是 指 系统 时 间 的 实际 时 间 (通常 由 原子 时 钟 等 精确 时 
钟 来 定义 ) 之 差 。 

不 要 试图 使 用 hwclock 来 修复 时 间 误 差 ， 因 为 这 会 影响 那些 基于 时 间 的 系统 事件 。 你 可 以 运 
行 adjtimex 来 更 新 系统 时 钟 , 不 过 最 好 的 办 法 是 使 用 守护 进程 来 使 你 的 系统 时 间 和 网 络 上 的 时 间 
保持 同步 (参见 7.5.2 节 )。 


7.5.1 内 核 时 间 和 时 区 


内 核 将 当前 的 系统 时 间 显 示 为 以 秒 为 单位 的 一 串 数 字 ， 自 UTC 时 间 1970 年 1 月 1 日 12:00 时 起 
开始 。 你 可 以 使 用 以 下 命令 来 查看 : 


$ date +%s 


为 了 保证 易 读 性 ,用 户 空间 程序 会 将 这 组 数字 转换 为 本 地 时 间 ,并 且 将 夏令 时 和 其 他 因素 ( 比 
如 印第安 纳 州 时 间 ) 都 考虑 在 内 。 文 件 /etc/localtime ( 二 进 制 文件 ) 用 来 控制 本 地 时 区 。 

时 区 信息 在 /usr/share/zoneinfo 目 录 中 ， 其 中 包含 了 时 区 及 其 别名 等 信息 。 如 果 要 手动 设置 时 
区 ， 可 以 将 /usr/share/zoneinfo 中 的 某 个 文件 复制 到 /etc/localtime ( 或 者 创建 一 个 符号 链接 ) 中 , 或 
者 使 用 系统 自 带 的 时 区 工具 。( 你 可 以 使 用 tzselect 命 令 寻 找 时 区 文件 。) 

如 果 要 为 shell 会 话 设 置 时 区 ， 可 以 将 Tz 环境 变量 设置 为 /usr/share/zoneinfo 中 的 某 个 文件 名 ， 
如 下 所 示 : 


$ export TZ=US/Central 
$ date 


和 其 他 环境 变量 一 样 ， 你 也 可 以 只 为 某 条 命令 的 执行 持续 时 间 设置 时 区 ， 如 下 所 示 : 


$ TZ=US/Central date 
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7.5.2 网络 时 间 


如 果 你 的 主机 连接 到 互联 网 ， 你 可 以 运行 网 络 时 间 协 议 (Network Time Protocol， 以 下 简称 
NTP ) 守护 进程 ,借助 远程 服务 器 来 更 新 时 间 。 很 多 Linux 系 统 自 带 NTP 守 护 进程 , 但 是 不 一 定 默 
认 开 启 。 你 可 以 安装 ntpd 包 来 运行 它 。 

如 果 你 想 手动 配置 ， 可 以 参考 NTP 网 站 http:/www.ntp.org。 如 果 你 想 偷 点 懒 也 没关系 ， 下 面 
是 简要 的 步骤 : 

(1) 从 你 的 ISP 或 者 ntp.org 获 得 离 你 最 近 的 NTP 服 务 器 ; 

(2) 将 该 服务 器 加 入 /etcmmtpd.conf 文 件 ; 

(3) 在 启动 时 运行 ntpdate server; 

(4) 启动 时 ， 在 ntpdate 命 令 之 后 运行 ntpd。 

如 果 你 的 主机 没有 连接 互联 网 ， 你 可 以 使 用 chronyd 守 护 进程 在 离线 状态 下 维护 系统 时 间 。 

在 系统 重启 时 , 你 还 可 以 根据 网 络 时 间 来 设置 系统 的 硬件 时 钟 ,为 的 是 帮助 系统 保持 时 间 的 
一 致 性 。( 很 多 Linux 系 统 会 自动 这 样 做 。) 使 用 ntpdate (或 者 ntpd ) 从 网 络 设置 系统 时 间 ， 然 后 
运行 我 们 在 前 面 介绍 过 的 命令 : 


# hwclock --systohc --utc 


7.6 使 用 cron 来 调度 日 常任 务 


Unix 的 cron( 意思 是 定时 ) 服务 能 够 按照 日 程 安排 来 重复 运行 程序 。cron 对 多 数 富 有 经 验 的 
系统 管理 员 来 说 非常 重要 ,因为 它 可 以 完成 很 多 自动 化 的 系统 维护 工作 。 比 如 , 它 运 行 日 志文 件 
的 替换 工具 来 确保 旧 的 日 志文 件 被 删除 以 腾 出 磁盘 空间 。 建 议 你 掌握 cron 的 使 用 方法 ， 这 对 你 会 
很 有 帮助 。 

你 可 以 使 用 cron 在 任何 时 间 运 行 任 何 程序 。 通 过 cron 运 行 的 程序 我 们 称 为 定时 任务 。 要 添加 
一 个 定时 任务 ， 可 以 在 crontab 〈 意 为 定时 任务 ) 文件 中 加 入 一 行 ， 通常 是 通过 执行 crontab 命 令 
来 完成 。 例 如 ， 你 若 想 将 /home/juser/bin/spmake 命 令 安 排 在 每 天 9:15AM 运 行 ， 可 以 加 入 以 下 
一 行 : 


15 09 * * * /home/juser/bin/spmake 


最 开始 的 5 列 用 空格 分 隔 ， 设 定 任务 运行 的 时 间 (参见 图 7-3 )， 它 们 的 含义 如 下 所 示 。 
口 分 (0~5$9 ): 上 例 中 是 15。 

口 时 (0~23 ): 上 例 中 是 09。 

口 天 (1~31)。 

口 月 (1~12)。 

口 星期 (0~7): 0 和 7 代表 周 日 。 
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Minute 


Hour 
Day of month 
[ rMonth 


Day of week 

| | | | | Command 
| 
15 09 * * * /home/juser/bin/spmake 
图 7-3” ”crontab 文件 中 的 条 目 
任意 位 置 出 现 的 星 号 表示 匹配 所 有 值 。 上 例 中 spmake 每 天 都 运行 ， 因 为 天 、 月 、 星 期 等 列 的 

值 都 是 星 号 ， 所 以 cron 就 把 它 解 读 为 “每 月 每 周 的 每 一 天 都 要 运行 这 个 任务 ”。 

如 果 只 想 在 每 个 月 的 14 号 运行 spmake， 可 以 使 用 下 面 这 行 设置 : 


15 09 14 * * /home/juser/bin/spmake 


每 一 列 可 以 有 多 个 值 。 例 如 ， 要 在 每 月 5 号 和 14 号 运行 程序 ， 可 以 将 第 三 列 设置 为 5,14: 


15 09 5,14 * * /home/juser/bin/spmake 


注解 ”如 果 cron 任 务 产 生 标 准 输 出 、 错 误 或 者 非 正 常 退 出 ， 你 会 收 到 一 封 邮 件 通 知 。 如 果 你 觉 
得 邮件 太 麻 烦 ， 可 以 将 输出 结果 重 定向 到 /dev/null 或 者 日 志文 件 中 。 


帮助 手册 crontab(5) 为 我 们 提供 了 有 关 crontab 的 详细 信息 。 
7.6.1 安装 crontab 文 件 


每 个 用 户 都 可 以 有 自己 的 crontab 文 件 ， 所 以 系统 中 经 常会 有 很 多 个 crontab ， 通 常 保存 在 
/Var/spool/cron/crontabs 目 录 中 。 普 通用 户 对 该 目录 没有 写 权 限 ，crontab 命 令 负 责 安装 、 查 看 、 编 
辑 和 删除 用 户 的 crontab。 

安装 crontab 最 简便 的 方法 是 将 crontab 条 目 放 入 一 个 文件 ( 如 file )， 然 后 运行 crontab file 命 
令 将 包 e 文 件 安装 为 你 的 crontab 。crontab 命 令 会 检查 文件 的 格式 ， 确 保 没 有 错误 。 你 可 以 使 用 
crontab -1 列 出 你 的 cron 任 务 。 使 用 crontab -r 删 除 crontab 文 件 。 

然而 在 你 第 一 次 创建 了 crontab 文 件 后 , 后续 使 用 临时 文件 来 进行 更 改 会 比较 麻烦 。 你 可 以 使 
用 crontab -e 命 令 来 更 改 并 安装 你 的 crontab。 如 果 有 错误 ，crontab 命 令 会 提示 你 错误 出 在 哪里 ， 
并 询问 是 否 重新 编辑 。 


7.6.2 ”系统 crontab 文 件 


Linux 系 统 通 常 使 用 /etc/crontab 文 件 来 安排 系统 任务 的 运行 ， 而 不 是 使 用 超级 用 户 的 crontab。 
不 要 使 用 crontab 命 令 来 编辑 该 文件 ， 因 为 它 有 一 个 额外 的 列 来 设置 运行 任务 的 用 户 。 例 如 下 面 
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这 一 行 设置 ， 任 务 在 6: 42AM 由 root ( @@ 人 处 ) 用 户 运行 : 


42 6 *** rootO /usr/local/bin/cleansystem > /dev/null 2>8&1 


注解 一些 系统 将 系统 crontab 文 件 存 放 在 /etc/cron.d 目 录 中 。 它 们 的 文件 名 也 许 不 同 ， 不 过 内 容 
格式 和 /etc/crontab 一 样 。 


7.6.3 ”cron 的 未 来 


cron 工 具 是 Linux 系 统 中 历史 最 长 的 组 件 之 一 ， 大 约 有 几 十 年 了 ， 甚 至 在 Linux 出 现 之 前 就 已 
经 存在 。 它 的 文件 格式 一 直 以 来 基本 上 没有 改变 。 由 于 它 实在 是 太 过 于 老 旧 ， 人 们 正在 想 办 法 替 
换 它 。 

它 的 可 行 的 替代 者 实际 上 是 新 版 本 的 init 的 一 部 分 : 对 于 systemd 来 说 是 计时 器 单元 ; 对 于 
Upstart 来 说 是 重复 产生 事件 来 触发 任务 。 总 之 它们 都 能 够 以 任何 用 户 的 名 义 运行 任务 , 并 且 拥 有 
诸如 定制 日 志 这 样 的 便利 之 处 。 

但 实际 上 目前 的 systemd 和 Upstart 都 还 不 具备 cron 的 全 部 功能 。 而 且 , 就 算 它 们 具备 所 有 功能 ， 
也 还 要 考虑 向 后 兼容 性 ， 要 能 够 支持 那些 依赖 于 cron 的 系统 。 从 这 个 意义 上 说 ，cron 还 不 会 这 么 
快 被 奉 代 。 


7.7 ”使 用 at 进行 一 次 性 任务 调度 


要 想 在 将 来 的 某 一 时 刻 一 次 性 运行 任务 ， 如 果 不 使 用 cron 的 话 ， 可 以 使 用 at 服务 。 例 如 要 在 
10:30PM 运 行 myjop， 可 以 使 用 以 下 命令 : 


$ at 22:30 
at> myjob 


使 用 CTRL-D 结 束 输入 。( at 从 标准 输入 读 取 命 令 。) 

要 检查 任务 是 否 已 经 被 设 定 , 可 以 使 用 atq。 要 删除 任务 ,使 用 atrm。 你 还 可 以 使 用 DD.MM.YY 
这 样 的 日 期 格式 将 任务 设置 为 将 来 某 一 时 刻 运 行 ， 如 : at 22:30 30.09.15。 

关于 at 命令 差不多 就 这 些 内 容 。 虽 然 它 不 太 常 用 , 不 过 在 某 些 场景 下 比较 有 用 ， 比 如 你 想 让 
系统 在 将 来 某 个 时 刻 关 闭 的 时 候 。 


7.8 了 解 用 户 ID 和 用 户 切 换 


我 们 已 经 介绍 过 ，sudo 和 su 这 样 的 setuid 程 序 允 许 你 切换 用 户 ，login 这 样 的 系统 组 件 负责 控 
制 用 户 访问 。 你 或 许 想 了 解 它 们 的 工作 原理 ， 以 及 内 核 在 用 户 切换 中 所 起 的 作用 。 


NN 
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更 改 用 户 ID 有 两 种 方式 ， 均 由 内 核 负 责 完 成 。 第 一 种 是 运行 setuid 程 序 ， 我 们 在 2.17 节 介绍 
过 。 第 二 种 是 通过 setuid() 系 统 调 用 ， 该 系统 调用 有 很 多 不 同 版 本 ， 用 来 处 理 和 进程 关联 的 所 有 
用 户 ID ， 我 们 将 在 7.8.1 节 详细 介绍 。 

内 核 负 责 为 进程 制定 规则 ， 规 定 哪些 能 做 ， 哪 些 不 能 做 。 下 面 是 三 个 基本 规则 : 

口 以 root (userid 0 ) 身份 运行 的 进程 可 以 调用 setuid() 来 切换 为 任何 其 他 用 户 ; 

口 没有 以 root 身 份 运行 的 进程 在 调用 setuid() 时 有 一 些 限制 ， 大 多 数 情 况 下 不 能 调用 
setuid(); 
口 任何 进程 ， 只 要 有 足够 的 文件 访问 权限 ， 都 可 以 运行 setuid 程 序 。 


注解 ”用 户 切 换 并 不 涉及 用 户 名 和 用 户 密码 。 这 是 用 户 空 间 的 概念 ， 我 们 在 7.3.1 节 介绍 过 并 将 
在 7.9.1 节 中 详细 介绍 。 


进程 归属 、 有 效 UID、 实 际 UID 和 已 保存 UID 


到 目前 为 止 , 本 书 所 讲 的 有 关 用 户 卫 的 内 容 都 是 简化 过 的 。 实 际 上 每 个 进程 都 有 超过 一 个 用 
户 ID。 我 们 提 到 过 的 有 效 UID ( effective user ID ，euid ) 是 用 来 设 定 某 一 进程 的 访问 权限 。 另 外 
还 有 一 个 UID 是 实际 UID (real user ID ，ruid )， 即 实际 启动 进程 的 UID。 当 你 运行 setuid 程 序 时 ， 
Linux 将 有 效 UID 设 置 为 程序 文件 的 拥有 者 ， 同 时 将 实际 UD 设置 为 你 的 UID。 

在 很 多 现代 系统 中 ， 有 效 UID 和 实际 UID 之 间 的 区 别 很 模糊 ， 以 至 于 很 多 文档 中 有 关 进 程 归 
属 的 内 容 都 是 不 正确 的 。 

我 们 可 以 将 有 效 UID 看 作 执 行者 ， 将 实际 UID 看 作 所 有 者 。 实 际 UID 是 可 以 与 进程 进行 交互 
的 用 户 ， 可 以 终止 进程 ， 向 进程 发 送信 号 。 例 如 ， 如 果 用 户 A 以 用 户 B 的 名 义 启动 了 一 个 新 进程 
(基于 setuid 权 限 )， 用 户 A 仍 然 是 该 进程 的 所 有 者 ， 并 且 可 以 终止 该 进程 。 

在 Linux 系 统 中 ,大 多 数 进程 的 有 效 UID 和 实际 UID 是 相同 的 。ps 和 其 他 系统 诊断 命令 默认 显 
示 有 效 UID 。 要 想 查看 你 系统 上 的 有 效 UID 和 实际 UID ， 可 以 使 用 以 下 命令 ， 但 你 会 发 现 ， 你 的 
系统 中 的 所 有 进程 几乎 拥有 相同 的 有 效 UID 和 实际 UID。 


$ ps -eo pid,euser,ruser,comm 


如 果 想 要 两 者 有 不 同 的 值 ， 可 以 为 sleep 命 令 创 建 一 个 setuid 副 本 ,运行 一 段 时 间 ， 然 后 在 其 
结束 前 使 用 ps 命令 在 男 一 个 终端 窗口 查看 它 的 信息 。 

除了 有 效 UID 和 实际 UID 外 ， 还 有 一 个 已 保存 UID ( saved user ID ， 通 常 没 有 简写 形式 )。 进 
程 在 运行 过 程 中 可 以 从 有 效 UID 切 换 到 实际 UID 和 已 保存 UID。( 实际 上 Linux 还 有 另外 一 个 UID， 
即 文件 系统 UID ， 但 很 少 用 到 ， 代 表 访 问 文件 系统 的 用 户 。) 

典型 的 Setuid 程 序 行为 

实际 UID 可 能 会 和 我 们 以 往 的 理解 有 冲突 。 我 们 也 许 会 有 疑问 ， 为 什么 要 经 常 和 不 同 的 用 户 
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ID 打 交道 ? 举 个 例子 , 假如 你 使 用 sudo 启 动 了 一 个 进程 ， 如 果 要 终止 它 , 仍然 需要 用 sudo， 但 这 
时 候 , 你 却 无 法 使 用 你 普通 用 户 的 身份 来 终止 它 。 疑 问 产生 了 ,这 时 你 的 普通 用 户 不 应 该 就 是 实 
际 用 户 身 份 吗 ? 为 什么 会 没有 权限 终止 程序 呢 ? 

产生 这 种 情况 ,是 因为 sudo 和 很 多 其 他 setuid 程 序 会 使 用 setuid() 这 样 的 系统 调用 来 显 式 地 更 
改 有 效 UIDD 和 实际 UID。 这 样 做 是 为 了 避免 一 些 由 于 各 UID 不 匹配 导致 的 副作用 和 权限 问题 。 


注解 ”如 果 你 对 用 户 ID 切换 的 细节 和 规则 感 兴趣 ， 可 以 查看 setuid(2) 帮 助手 册 ， 还 可 以 参考 SEE 
ALSO 部 分 列 出 的 其 他 帮助 手册 。 这 些 帮助 手册 里 涉及 很 多 针对 不 同情 况 的 系统 调用 。 


有 些 程序 不 想 把 它们 的 实际 UID 设 置 成 root。 要 防止 sudo 更 改 实际 UID, 可 以 将 下 面 一 行 加 入 
你 的 /etc/sudoers 文 件 (请 注意 使 用 root 运 行程 序 可 能 带 来 的 副作用 )。 


Defaults stay_setuid 


相关 安全 性 

因为 Linux 内 核 通 过 setuid 程 序 和 相关 系统 调用 来 处 理 用 户 切换 ( 以 及 相关 的 文件 存 取 权限 )， 
系统 管理 员 和 开发 人 员 必 须 特 别 注意 以 下 两 点 。 

口 有 setuid 权 限 的 程序 。 

口 这 些 程序 所 执行 的 功能 。 

如 果 你 创建 了 一 个 bash shell 的 副本 ，setuid 为 root, 普通 用 户 就 可 以 运行 它 来 获得 整个 系统 的 
控制 权 , 就 是 这 么 简单 。 另 外 , setuid 为 root 的 程序 中 的 bug 也 有 可 能 会 为 系统 带 来 风险 。 攻击 Linux 
系统 的 常见 方式 之 一 就 是 利用 那些 以 root 名 义 运 行 的 程序 的 漏洞 ， 这 样 的 例子 数不胜数 。 

由 于 攻击 系统 的 手段 众多 , 因此 防止 系统 受到 攻击 也 是 一 项 十 分 繁重 的 任务 。 其 中 最 有 效 的 
方式 之 一 是 强制 使 用 用 户 名 和 密码 进行 验证 。 


7.9 用 户 标识 和 认证 


多 用 户 系 统 必须 支持 用 户 标 识 ( identification ) 和 用 户 认 证 〈authentication )， 以 保证 基本 的 
用 户 安全 。 用 户 标识 判定 用 户 的 身份 , 即 询问 你 是 哪 一 位 用 户 。 用 户 认 证 让 用 户 来 证 明 自 己 就 是 
声称 的 那 位 用 户 。 此 外 ， 用 户 授权 (authorization ) 用 来 限定 用 户 的 权限 。 

对 于 用 户 标识 ，Linux 内 核 通 过 用 户 ID 来 管理 进程 和 文件 的 权限 。 对 于 用 户 认 证 ，Linux 内 核 
控制 如 何 执行 setuid， 以 及 如 何 让 用 户 ID 执行 setuid() 系 统 调用 来 切换 用 户 。 然 而 ， 内 核对 于 运 
行 在 用 户 空间 中 的 有 关 用 户 认 证 的 相关 事宜 却 一 无 所 知 ， 比 如 用 户 名 和 用 户 密码 等 等 。 

我 们 在 7.3.1 节 中 介绍 过 用 户 ID 和 密码 的 对 应 关系 , 现在 我 们 来 介绍 用 户 进程 如 何 使 用 这 些 对 
应 关系 。 我 们 先 看 一 个 简化 的 例子 , 即 用户 进 程 需要 知道 它 的 用 户 名 ( 与 有 效 UID 对 应 的 用 户 名 )。 
在 传统 的 Unix 系 统 中 ， 进 程 会 通过 以 下 步 又 获得 用 户 名 。 

(1) 进程 使 用 geteuid() 系 统 调用 从 内 核 处 获得 它 的 有 效 UID。 
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(2) 进程 打开 并 浏览 /etc/passwd 文 件 。 
(3) 进程 从 /etc/passwd 文 件 中 读 取 其 中 的 一 行 。 如 果 没 有 可 读 取 的 内 容 , 则 进程 获取 用 户 名 失败 。 
(4) 进程 将 整 行内 容 解 析 为 字段 ( 就 是 用 冒号 分 隔 的 列 )。 第 3 列 即 是 当前 行 的 用 户 ID。 
(5) 进程 将 第 4 步 中 获得 的 用 户 ID 和 第 1 步 中 的 用 户 ID 进 行 匹 配 ， 如 果 匹 配 成 功 , 则 该 行 的 第 1 
列 即 为 要 找 的 用 户 名 ， 整 个 过 程 结束 。 
(6) 进程 继续 读 取 /etc/passwd 文 件 中 的 下 一 行 ， 并 返回 第 3 步 。 
事实 上 ， 这 个 过 程 比较 长 ， 实 际 执行 起 来 要 复杂 得 多 。 


为 用 户 信息 使 用 库 


如 果 上 述 过程 要 让 每 个 有 此 需求 的 开发 人 员 自 己 实现 的 话 , 整个 系统 会 变 得 支离破碎 , 错误 
百出 , 难以 维护 。 万幸 的 是 , 一 旦 你 从 geteuid() 获 得 用 户 ID , 你 需要 做 的 就 只 是 调用 像 getpwuid() 
这 样 的 标准 库 函 数 来 获得 用 户 名 。( 这 些 调 用 的 详细 使 用 方法 可 参考 帮助 手册 。) 

有 了 共享 的 标准 库 , 你 可 以 自己 对 需要 的 功能 做 一 系列 的 加 工 而 不 会 影响 到 其 他 程序 。 比 如 ， 
你 可 以 不 用 /etc/passwd， 而 是 使 用 LDAP 这 样 的 网 络 服务 来 获得 用 户 名 。 

上 述 方 法 对 于 通过 用 户 ID 得 到 对 应 的 用 户 名 来 说 行 得 通 , 但 是 对 于 密码 来 说 就 不 行 了 。 我 们 
在 7.3.1 节 中 介绍 过 ， 一 般 来 说 ， 经 过 加 密 的 密码 是 /etcpasswd 的 一 部 分 ， 如 果 你 要 验证 用 户 输入 
的 密码 ， 你 需要 将 用 户 输入 的 密码 加 密 ， 然 后 和 /etc/passwd 文 件 中 的 密码 进行 比 对 。 

这 样 的 传统 实现 方式 有 下 面 几 个 局 限 。 

口 加 密 协 议 并 没有 一 个 系统 层面 的 统一 标准 。 

口 它 假定 的 前 提 是 你 需要 对 加 密 密 码 有 访问 权限 。 

口 它 假定 的 前 提 是 每 当 用 户 需 要 访问 资源 的 时 候 ， 你 都 要 让 用 户 输入 用 户 名 和 密码 (这 会 

让 人 抓 狂 )。 

口 它 假定 的 前 提 是 你 使 用 密码 。 如 果 你 使 用 的 是 一 次 性 标记 、 智 能 卡 、 生 物 识别 技术 或 者 
其 他 形式 的 验证 ， 你 需要 自己 加 入 对 它们 的 支持 。 

上 述 的 一 些 局 限 也 促成 了 影子 密码 机 制 的 开发 , 我 们 在 7.3.3 节 中 介绍 过 。 它 就 是 建立 系统 层 
面 的 密码 配置 标准 所 迈 出 的 第 一 步 。 不 过 上 述 大 部 分 的 问题 促成 了 PAM 解 决 方案 的 出 现 。 


7.10 PAM 


为 了 提高 用 户 验 证 的 灵活 性 ，Sun Microsystems 公 司 在 1995 年 提出 了 一 个 新 的 标准 ， 叫 作 可 
插入 验证 模块 (Pluggable Authentiation Module, 以 下 简称 PAM ), 它 是 一 个 共享 的 验证 库 ( 由 Open 
Source Software Foundation RFC 86.0 组 织 于 1995 年 10 月 提出 )。 进行 用 户 验 证 的 时 候 ， 用 户 被 提交 
给 PAM 来 决定 该 用 户 是 否 能 够 成 功 完成 验证 。 这样 比 较 容易 加 入 新 的 验证 方式 和 技术 ,比如 两 段 
式 验 证 和 物理 钥匙 。 除 了 对 验证 机 制 的 支持 , PAM 还 提供 一 些 有 限 的 验证 控制 服务 ( 如 可 以 对 某 
些 用 户 禁 | 上 cron 这 样 的 服务 )。 

因为 用 户 验 证 的 应 用 场景 很 多 , 所 以 PAM 使 用 了 一 系列 可 以 动态 加 载 的 验证 模块 。 每 个 模块 
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负责 一 个 具体 的 任务 ， 比 如 pam_unix.so 模 块 负责 检查 用 户 密码 。 

这 样 的 任务 很 不 简单 。 编 程 接口 都 很 复杂 ，PAM 看 起 来 也 没有 能 够 解决 所 有 的 问题 。 无 论 怎 
样 ，Linux 系 统 中 涉及 用 户 验证 的 程序 基本 上 都 是 使 用 PAM， 大 部 分 Linux 系 统 也 是 使 用 PAM。 
为 PAM 是 基于 Unix 现 有 的 验证 API， 所 以 在 集成 PAM 文 持 的 时 候 只 需 少 量 的 额外 工作 即 可 。 


7.10.1 _PAM 配 置 


我 们 将 通过 PAM 的 配置 来 了 解 PAM 的 工作 原理 。PAM 的 应 用 配置 文件 通常 存放 在 /etc/pam.d 
目录 (在 较 老 的 系统 中 有 可 能 是 /etc/pam.conf 文 件 ), 目录 中 的 文件 很 多 , 可 能 会 让 人 找 不 到 头绪 。 
一 些 文件 名 应 该 会 包含 一 些 你 熟知 的 系统 名 称 ， 比 如 cron 和 passwd。 

由 于 这 些 配置 文件 在 不 同 的 Linux 系 统 上 各 异 ， 我 们 很 难 找到 一 个 通用 的 例子 。 我 们 以 chsh 
的 配置 文件 中 的 一 行为 例 : 


auth Tequisite pam shells.so 


该 行 表示 用 户 的 shell 必 须 在 /etc/shells 中 ， 以 便 使 用 户 能 够 与 chsh 顺 利 进行 验证 。 配 置 文件 中 

每 一 行 有 三 个 字段 ， 按 顺序 依次 是 功能 类 型 、 控 制 参数 和 模块 。 以 下 是 它们 代表 的 意思 。 

口 功能 类 型 : 是 指 某 个 用 户 应 用 程序 请 求 PAM 执 行 的 任务 。 本 例 中 是 auth， 即 用 户 验 证 的 

任务 。 

口 控制 参数 : 指定 PAM 在 成 功 执行 任务 或 者 任务 执行 失败 后 的 操作 〈 本 例 中 为 requisite )。 

这 一 点 我 们 稍 后 会 详细 介绍 。 

口 模块 : 指定 该 行 所 运行 的 验证 模块 。 本 例 中 pam_shells.so 模 块 检查 用 户 shell 是 否 在 
/etc/shells 中 。 关 于 PAM 配 置 的 详细 内 容 ， 你 可 以 查看 pam.conf(5) 帮 助手 册 。 现 在 先 来 看 
一 些 PAM 的 基础 内 容 。 

功能 类 型 

用 户 应 用 程序 可 以 请 求 PAM 执 行 以 下 四 类 功能 。 

D auth: 用 户 验 证 ( 验证 用 户 身 份 )。 

口 account: 检查 用 户 账号 状态 ( 例如 用 户 是 否 对 某 一 操作 有 权限 )。 

口 session: 仪 在 用 户 当 前 进程 内 执行 ( 例如 显示 当日 的 消息 )。 

口 password: 更 改 用 户 密码 或 其 他 验证 信息 。 

对 于 任何 配置 行 来 说 , 功能 类 型 和 模块 会 共同 决定 PAM 执 行 的 操作 。 一 个 模块 可 以 有 多 个 功 

能 类 型 ， 所 以 当 我 们 查看 配置 行 时 ， 需 要 结合 功能 类 型 和 模块 来 确定 该 行 的 功能 。 比 如 ， 

pam_unix.so 模 块 在 执行 auth 时 检查 密码 ， 但 是 在 执行 password 时 却 是 设置 密码 。 

控制 参数 和 堆栈 规则 

PAM 的 一 个 重要 特性 是 它 的 配置 行 中 使 用 堆栈 定义 的 规则 。 也 就 是 说 , 你 可 以 为 执行 的 操作 
定义 一 些 规则 。 这 也 凸显 了 控制 参数 的 重要 性 : 某 一 行 任 务 执 行 的 成 败 会 影响 到 后 面 的 行 甚 至 整 
个 任务 执行 的 成 败 。 
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控制 参数 有 两 类 : 简单 语法 和 高 级 语法 。 简 单 语法 的 控制 参数 主要 有 以 下 三 种 。 

D sufficient: 如 果 该 规则 执行 成 功 , 用户 验证 即 成 功 ， PAM 会 忽略 其 他 规则 。 如 果 规 则 执 

行 失 败 ， 则 PAM 继 续 执 行 其 他 规则 。 

D requisite: 如 果 该 规则 执行 成 功 ，PAM 继 续 执 行 其 他 规则 。 如 果 规 则 执行 失败 ， 用 户 验 

证 即 失败 ，PAM 会 忽略 其 他 规则 。 

D required: 如 果 该 规则 执行 成 功 ，PAM 继 续 执 行 其 他 规则 。 如 果 规 则 执行 失败 ，PAM 继 
续 其 他 规则 ， 但 是 无 论 其 他 规则 执行 结果 如 何 ， 最 终 的 验证 将 失败 。 

让 我 们 继续 上 例 ， 下 面 是 chsh 验 证 的 一 个 堆栈 实例 ; 


auth 
auth 
auth 
auth 


sufficient pam rootok.so 
requisite pam_shells.so 
sufficient pam_unix.so 
required pam deny.so 


当 chsh 请 求 PAM 执 行 用 户 验 证 时 ， 根 据 以 上 配置 ， PAM 执 行 以 下 步骤 ( 见 图 7-4 )。 


启动 : 请 求 验证 


pam_rootok.so:root 
是 理 正在 尝试 验证 ? 


shell 是 否 在 /etc/shells 中 ? 


pam unix.so: 


户 输入 的 密码 是 否 


pam_deny.so: 总 是 失败 


图 7-4 PAM 规 则 执行 流程 
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(1) pam_rootok.so 模 块 检查 进行 验证 的 用 户 是 否 是 root。 如 果 是 的 话 ， 则 验证 立即 通过 并 日 忽 
略 其 他 后 续 验 证 ,这 是 因为 控制 参数 是 sufficient, 表示 当前 操作 执行 成 功 , PAM 会 立即 通知 chsh 
验证 成 功 。 和 否则 继续 执行 步骤 2。 

(2) pam_shell.so 模 块 检查 用 户 的 shell 是 否 在 /etc/shells 中 。 如 果 不 是 的 话 ， 模 块 返回 失败 ， 
requisite 控 制 参 数 表 示 PAM 应 立即 通知 chsh 验 证 失败 ， 并 忽略 其 他 后 续 验 证 。 如 果 shell 在 
/etc/shells 中 ,模块 返回 验证 成 功 ， 并 且 根 据 控制 参数 required 继 续 执行 步骤 3。 

(3) pam_unix.so 模 块 要 求 用 户 输入 密码 并 检查 。 控 制 参数 为 sufficient， 意 思 是 该 模块 验证 
通过 后 ，PAM 即 向 chsh 报 告 验证 成 功 。 如 果 输 入 密码 不 正确 ，PAM 继 续 步 又 4。 

(4) pam_deny.so 模 块 总 是 返回 失败 ， 且 由 于 控制 参数 为 required，PAM 向 chsh 返 回 验 证 失败 。 
在 没有 其 他 规则 的 情况 下 ， 这 是 默认 的 操作 。( 请 注意 ，required 控 制 参数 并 不 导致 FAM 立即 失 
败 ， 它 还 会 继续 后 续 的 操作 ， 但 是 最 终 还 是 返回 验证 失败 。) 


注解 ”在 讨论 PAM 的 时 候 , 不 要 将 功能 和 操作 混淆 起 来 ,功能 是 高 层次 的 目标 , 即 用 户 请 求 PAM 
执行 的 操作 ( 诸如 用 户 验证 ),。 操作 是 PAM 为 了 达到 目标 执行 的 菜 个 具体 任务 。 你 只 需要 
记 住 ， 用 户 应 用 程序 首先 执行 功能 ， 然 后 PAM 负 责 执行 相关 操作 。 


高 级 语法 的 控制 参数 使 用 方 括号 ([] ) 表示 ， 让 你 能 够 根据 模块 的 返回 值 (不 仅仅 是 成 功 和 
失败 两 种 ) 手动 定义 相应 的 操作 。 详 情 可 以 查看 pam.conf(5) 帮 助 文档 。 了 解 了 简单 语法 控制 参数 
后 ， 高 级 语法 控制 参数 就 不 是 问题 了 。 

模块 参数 

PAM 模 块 能 够 在 模块 名 后 带 参 数 。 在 pam_unix.so 模 块 中 你 经 常会 看 到 类 似 下 面 的 内 容 : 


auth sufficient pam unix.so nullok 
参数 nullok 表 示 用 户 可 以 不 需要 密码 ( 如 果 用 户 没 有 密码 则 默认 为 验证 失败 )。 


7.10.2 ”关于 PAM 的 一 些 注解 


由 于 其 拥有 控制 流 能 力 和 模块 参数 语法 ，PAM 配 置 语 法 具备 了 编程 语言 的 某 些 特征 和 功能 。 
目前 我 们 仅仅 是 介绍 了 皮毛 ， 下 面 是 更 多 关于 PAM 的 介绍 。 

口 可 以 使 用 man -k pam_( 请 注意 此 处 的 下 划 线 ) 来 列 出 系统 中 的 PAM 模 块 。 要 查看 这 些 模块 

的 存放 位 置 可 能 会 很 难 ， 你 可 以 用 locate unix_pam.so 命 令 试 试 运气 。 

口 帮助 手册 中 有 每 个 模块 相关 功能 和 参数 的 详细 信息 。 

口 很 多 Linux 系 统 会 自动 生成 一 些 PAM 配 置 文件 , 所 以 尽量 不 要 在 /etc/pam.d 目 录 中 直接 对 它 
们 进行 更 改 。 在 做 更 改 之 前 请 阅读 /etc/pam.d 文 件 中 的 注释 信息 ， 如 果 它 们 是 由 系统 生成 
的 文件 ， 注 释 中 会 对 来 源 加 以 说 明 。 

口 /etc/pam.d/other 配 置 文件 中 包含 默认 配置 ， 用 于 那些 没有 自己 的 配置 文件 的 应 用 程序 。 默 
认 配 置 往往 是 拒绝 所 有 的 验证 。 
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口 在 PAM 配 置 文件 中 包含 其 他 配置 文件 的 方法 有 很 多 种 。 可 以 使 用 einclude 语 法 加 载 整个 配 
置 文件 ， 也 可 以 使 用 控制 参数 来 加 载 某 个 特定 功能 的 配置 文件 。 不 同 的 系统 有 不 同 的 加 
载 方式 。 

口 PAM 配 置 不 以 模块 参数 结束 。 一 些 模块 可 以 访问 /etc/security 中 的 其 他 文件 ， 通 常用 来 配 

置 针对 某 个 用 户 的 特定 限制 。 


7.10.3” PAM 和 密码 


Linux 密 码 校 验 近 年 来 不 断 发 展 ， 留 下 了 很 多 密码 配置 包 ， 有 些 时 候 容 易 产生 混淆 。 首 先是 
/etc/login.defs 这 个 文件 ， 它 是 最 初 影子 密码 的 配置 文件 。 其 中 包含 了 用 于 影子 密码 文件 加 密 算法 
的 信息 , 不 过 使 用 PAM 的 新 版 本 系统 很 少 使 用 它 了 ,因为 PAM 配 置 中 自己 包含 了 这 些 信息 。 但 即 
便 如 此 ， 有 时 候 /etc/login.defs 中 的 加 密 算 法 必须 和 PAM 配 置 中 的 相 匹 配 ， 以 防 万 一 有 的 应 用 程序 
不 支持 PAM。 

PAM 是 从 哪里 获得 密码 加 密 信息 呢 ? 我 们 前 面 讲 过 , PAM 处 理 密码 的 方式 有 两 种 : 通过 auth 
功能 ( 用 来 校 验 密码 ) 和 password 功 能 ( 用 来 设置 密码 )。 查 看 密码 设置 参数 很 容易 ， 最 佳 方式 
是 使 用 grep， 如 下 所 示 : 


$ grep password.*unix /etc/pam.d/* 


匹配 的 行 中 应 该 包含 pam_unix.so， 像 下 面 这 样 : 


password sufficient pam unix.so obscure sha512 


参数 obscure 和 sha512 告 诉 PAM 在 设置 密码 时 执行 什么 操作 。 首 先 ，PAM 检 查 密 码 是 否 足够 
复杂 (也 就 是 说 ， 新 密码 不 能 和 老 密 码 太 相似 等 等 )， 然 后 PAM 使 用 SHA512 算 法 来 加 密 新 密码 。 

但 这 只 在 用 户 设置 密码 时 生效 , 而 不 是 在 PAM 校 验 密码 时 。PAM 是 怎样 知道 在 用 户 验证 时 使 
用 哪个 算法 呢 ? 配置 信息 中 没有 这 方面 的 信息 , 对 于 pam_unix.so 的 auth 功 能 来 说 , 没有 针对 加 密 
言 息 的 参数 ， 帮 助手 册 里 也 没有 。 

事实 上 ，( 直至 本 书 成 书 时 ) pam_unix.so 仅 仅 是 靠 猜 测 ， 通 常 是 通过 libcrypt 库 来 逐一 尝试 每 
个 文件 ， 直 至 找 出 使 用 的 那个 算法 , 或 者 直至 没有 可 尝试 的 文件 。 所 以 你 通常 不 用 太 担 心 密码 校 
验 加 密 算法 。 


7.11 前瞻 


至 此 我 们 已 经 到 达 的 全 书 的 一 半 ， 介 绍 了 Linux 系 统 的 很 多 关键 组 成 部 分 。 特 别 是 关于 日 志 
和 用 户 的 内 容 ， 让 你 了 解 到 Linux 系 统 是 如 何 将 服务 和 任务 分 解 为 小 而 独立 的 部 分 ， 并且 仍然 能 
够 进行 一 定 深度 的 交互 。 

本 音 主 要 是 用 户 空间 方面 的 内 容 , 我 们 需要 对 用 户 空间 进程 和 它们 消耗 的 资源 有 一 个 新 的 认 
识 。 因 此 ， 在 第 8 章 中 我 们 会 讲解 一 些 关 于 内 核 的 深层 次 的 内 容 。 


ey 
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进程 与 资源 利用 详解 


本 章 我 们 将 深入 介绍 进程 之 间 的 关系 、 内 核 和 系统 资 
源 。 计 算 机 硬件 资源 主要 有 三 种 : CPU、 内 存 和 IO。 进 程 
为 获得 这 些 资源 相互 竞争 ， 内 核 则 负责 公平 地 分 配 资源 。 内 
核 本 身 也 是 一 种 软件 资源 ， 进 程 通过 它 来 创建 新 的 进程 ， 并 
和 其 他 进程 通信 。 


本 章 介 绍 的 工具 当中 , 有 很 多 涉及 性 能 监控 。 在 你 试图 找 出 系统 变 慢 的 原因 时 ,这 些 工具 会 
非常 有 帮助 。 然 而 我 们 不 需要 过 多 关注 系统 性 能 ,因为 对 已 经 运行 良好 的 系统 进行 优化 往往 是 浪 
费时 间 。 我 们 应 该 更 多 地 了 解 这 些 工具 的 功能 ， 同时 在 此 过 程 中 我 们 会 对 内 核 有 更 深入 的 了 解 。 


8.1 进程 跟踪 


我 们 在 2.16 节 介绍 过 如 何 使 用 ps 命令 查看 系统 中 运行 的 进程 。ps 命 令 列 出 当前 运行 的 进程 ， 
但 是 无 法 提供 进程 随时 间 变 化 的 情况 ， 因 而 你 无 法 得 知 哪个 进程 使 用 了 过 多 的 CPU 时 间 和 内 存 。 
在 这 方面 ，top 命 令 比 ps 命令 更 有 用 些 ， 因 为 它 能 够 显示 系统 的 当前 状态 ， 还 有 ps 命令 结果 
显示 的 许多 字段 ， 并 且 每 秒 更 新 一 次 信息 。 但 最 重要 的 是 ，top 命 令 将 系统 中 最 活跃 的 进程 ( 即 
当前 消耗 CPU 时 间 最 多 的 那些 进程 ) 显示 在 最 上 方 。 
你 可 以 通过 键盘 向 top 发 送 命 令 。 下 面 是 一 些 比 较 重要 的 键盘 命令 。 
空格 键 。 ”立即 更 新 显示 内 容 。 
按照 当前 内 存 使 用 量 排序 。 
按照 CPU 累计 使 用 量 排序 。 
按照 当前 CPU 使 用 量 (默认 ) 排序 。 
仅 显 示 某 位 用 户 的 进程 。 
选择 不 同 的 统计 信息 来 显示 。 
为 所 有 top 命 令 显 示 使 用 情况 统计 。 


"ci 
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Linux 中 另外 还 有 两 个 类 似 于 top 的 工具 ， 提 供 更 详细 的 信息 和 更 丰富 的 功能 ， 它 们 是 atop 和 
htop。 还 有 另外 一 些 工具 提供 额外 的 功能 ， 比 如 htop 命 令 包含 一 些 1sof 命 令 的 功能 ， 其 中 1sof 我 
们 将 在 下 节 介 绍 。 


8.2 使 用 1sof 查看 打开 的 文件 


1sof 命 令 列 出 打开 的 文件 以 及 使 用 它们 的 进程 。 由 于 Unix 系 统 大 量 使 用 文件 ， 所 以 lsof 在 系 
统 排 错 方面 是 最 有 用 的 命令 之 一 。 但 1sof 不 仅仅 显示 常规 文件 ， 还 显示 网 络 资源 、 动 态 库 以 及 管 


8.2.1 ”1sof 输 出 


1sof 的 输出 结果 通常 信息 量 很 大 ， 如 下 面 的 例子 中 ,你 看 到 的 只 是 其 中 一 些 片 段 。 这 一 输出 
结果 中 包含 init 进 程 中 打开 的 文件 和 运行 中 的 vi 进程 : 


$ lsof 

COMMAND PID USER FD TYPE DEVICE SIZE NODE NAME 

init 1 root cwd DIR 8,1 4096 2 / 

init 1 root rtd DIR 8,1 4096 2 / 

init 1 root mem REG 8, 47040 9705817 /lib/i386-linux-gnu/libnss files-2.15.so 
init 1 root mem REG 8,1 42652 9705821 /1ib/i386-linux-gnu/libnss nis-2.15.so 
init 1 root mem REG 8,1 92016 9705833 /1ib/i386-linux-gnu/libnsl-2.15.so 

-- Snip-- 


vi 22728 juser cwd DIR 8,1 4096 14945078 /home/juser/w/c 
vi 22728 juser 4u REG 8,1 1288 1056519 /home/juser/w/c/f 


-- Snip-- 
其 中 包含 以 下 字段 。 
口 COMMAND: 拥有 文件 描述 符 的 的 进程 对 应 的 命令 名 。 
OD PIM: PID, 


口 USER: 运行 进程 的 用 户 。 
口 FD: 该 列 包 含 两 种 元 素 。 本 例 中 FD 列 显示 文件 的 作用 。 该 列 还 能 够 显示 打开 文件 的 描述 
符 。 文 件 描述 符 是 一 个 数字 ， 进 程 通过 它 使 用 系统 库 和 内 核 来 进行 文件 标识 和 操作 。 
D TYPE: 文件 类 型 ( 如 常规 文件 、 目 录 、 套 接 字 等 )。 
口 DEVICE: 包含 该 文件 的 设备 的 主要 代码 和 次 要 代码 。 
口 SIZE: 文件 大 小 。 
口 NODE: 文件 的 索引 节点 编号 。 
口 NAME: 文件 名 。 
以 上 各 字段 所 有 可 能 的 值 可 以 在 帮助 手册 lsof(1) 查 看 ， 不 过 只 看 输出 结果 应 该 就 很 清楚 了 。 
例如 ，FD 列 中 使 用 加 粗 字体 标 出 cwd 的 那些 行 ， 它 们 显示 当前 进程 的 工作 目录 。 男 一 个 例子 是 最 
后 一 行 ， 它 显示 用 户 正 在 使 用 vi 编辑 的 文件 。 
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8.2.2 ”1sof 的 使 用 


运行 1sof 有 以 下 两 种 基本 方式 。 
口 输出 完整 的 结果 , 然后 将 输出 结果 通过 管道 用 命令 less 显 示 , 然后 在 其 中 搜索 你 想 要 的 内 
容 。 由 于 输出 结果 信息 量 很 大 ， 该 方法 可 能 会 花 点 时 间 。 
口 使 用 命令 行 选项 来 过 滤 1sof 的 输出 结果 。 

你 可 以 使 用 命令 行 选项 提供 一 个 文件 名 作为 参数 ， 然 后 使 用 1sof 显 示 只 和 参数 匹配 的 条 目 。 
例如 ， 下 面 的 命令 显示 /sr 目录 中 所 有 打开 的 文件 : 


$ lsof /usr 


根据 PID 列 出 打开 文件 ， 使 用 以 下 命令 : 


$ lsof -p pid 


你 可 以 运行 1sof -h 查 看 lsof 所 有 的 选项 。 大 部 分 选项 和 输出 格式 有 关 。( 请 参考 第 10 章 中 关 
于 1sof 网 络 特性 的 介绍 。) 


注解 lsof 和 内 核 信息 密切 相关 。 如 果 你 升级 内 核 时 没有 按 常规 升级 系统 的 其 他 部 分 ， 你 可 能 
需要 升级 1sof。 如 果 你 同时 升级 了 内 核 和 lsof, 新 的 lsof 可 能 需要 你 重新 启动 新 内 核 以 后 
才能 够 正常 工作 。 


8.3 ”跟踪 程序 执行 和 系统 调用 


到 目前 为 止 , 我 们 介绍 的 工具 都 是 针对 运行 中 的 进程 。 然 而 ， 有 时 候 你 的 程序 可 能 在 系统 启 
动 后 马上 就 终止 了 ， 这 时 你 可 能 会 一 头 雾 水 ，1sof 命 令 也 不 管用 了 。 实 际 上 ， 使 用 1sof 查 看 执行 
失败 的 进程 非常 困难 。 

strace( 系统 调用 跟踪 ) 和 1ltrace ( 系统 库 跟 踪 ) 命令 能 够 帮助 你 了 解 程序 试图 执行 哪些 操 
作 。 它们 的 输出 信息 量 都 很 大 , 不 过 一 旦 你 确定 了 查找 的 范围 ， 有 很 多 工具 可 以 帮助 你 定位 需要 
的 信息 。 


8.3.1 strace 命 令 


之 前 介绍 过 ,系统 调用 是 用 户 空 间 请 求 内 存 执行 的 经 过 授权 的 操作 , 诸如 打开 文件 、 读 取 数 
据 等 等 。strace 能 够 显示 进程 涉及 的 所 有 系统 调用 。 可 以 通过 下 面 的 命令 查看 : 


$ strace cat /dev/null 


在 第 1 章 中 我 们 介绍 过 ， 如 果 一 个 进程 想 启动 男 一 个 进程 ， 该 进程 会 使 用 fork() 系 统 调用 来 
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从 自身 创建 出 一 个 副本 ， 然 后 副本 调用 exec() 系 统 调用 集 来 启动 和 运行 新 的 程序 。strace 命 令 在 
fork() 系 统 调用 之 后 开始 监控 新 创建 的 进程 ( 即 源 进程 的 副本 )。 因 而 该 命令 输出 结果 的 一 开始 
儿 行 应 该 显示 execve() 的 执行 情况 ， 随 后 是 内 存 初始 化 系统 调用 brk()， 如 下 所 示 : 


execve("/bin/cat", ["cat", "/dev/null"], [/* 58 vars */])=0 
brk(0) = Ox9b65000 


输出 的 后 续 部 分 涉及 共享 库 的 加 载 。 除非 你 想 知 道 加 载 共 享 库 的 细节 , 否则 你 可 以 忽略 这 些 


access("/etc/1d.so.nohwcap", F_OK) = -1 ENOENT (No such file or directory) 
mmap2(NULL, 8192, PROT_ READ|PROT WRITE, MAP_PRIVATE|MAP ANONYMOUS, -1, 0) = Oxb77b5000 
access("/etc/1d.so.preload", R_OK) = -1 ENOENT (No such file or directory) 
open("/etc/ld.so.cache", 0O_ RDONLY|O CLOEXEC) = 3 

-- Snip-- 

open("/lib/libc.so.6", 0 RDONLY) = 3 


read(3, "\177ELF\1\1\1\0\0\O\O\O\O0\O0\0\0\3\0\3\0\1\0\0\0\200^\1"..., 1024)= 1024 


除 此 之 外 ， 你 可 以 跳 过 输出 结果 中 的 mmap， 直 到 下 面 的 部 分 : 


fstat64(1, {st mode=S IFCHR|0620, st rdev=makedev(136, 6), ...})=0 
open("/dev/null", O RDONLY|O LARGEFILE) = 3 

fstat64(3, {st mode=S IFCHR|0666, st rdev=makedev(1, 3), ...})= 0 
fadvise64 64(3, 0, 0, POSIX FADV SEQUENTIAL)= 0 


read(3,"", 32768) =0 
close(3) =0 
close(1) =0 
close(2) =0 
exit group(0) 二 这 


这 部 分 内 容 显示 正在 运行 中 的 命令 。 首 先 我 们 来 看 看 open() 调 用 ， 它 用 来 打开 文件 。 返 回 值 
3 代表 执行 成 功 (3 是 内 核 成 功 打开 文件 后 返回 的 文件 描述 符 )。 在 它 下 面 ， 你 可 以 看 到 cat 从 
/dev/null ( read() 中 也 包含 文件 描述 符 3 ) 读 取 数 据 。 在 读 取 完 所 有 数据 后 , 程序 关闭 文件 描述 符 ， 
并 调用 exit_group() 退 出 。 

如 果 过 程 中 发 生 错误 会 出 现 什 么 情况 ?你 可 以 使 用 strace cat not_a_file 命 令 来 检查 open() 
的 执行 情况 : 


open("not a file", O RDONLY|O LARGEFILE) = -1 ENOENT (No such file or directory) 


上 面 显 示 open() 无 法 打开 文件 ， 它 返回 -1 代表 出 错 。 你 可 以 看 到 ，strace 显 示 确 切 的 错误 代 
码 ， 并 对 错误 进行 简短 的 描述 。 
Unix 上 的 程序 经 常会 遇 到 无 法 找到 文件 的 情况 。 当 系统 日 志和 其 他 日 志 无 法 提供 有 帮助 的 信 
息 ， 你 也 别 无 他 法 时 ， 可 以 使 用 strace。strace 黄 至 还 可 以 用 于 那些 已 经 和 源 进程 分 离 的 守护 进 
程 ， 如 : 
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$ strace -0 crummyd strace -ff crummyd 


上 面 的 -o 选 项 为 所 有 由 crummyd 产 生 的 子 进程 记录 日 志 ， 并 保存 到 crummyd.strace.pid 文 件 
中 。 其 中 pid 是 子 进程 的 PID。 


8.3.2 ”1trace 命 令 


ltrace 命 令 跟 踪 对 共享 库 的 调用 。 它 的 输出 结果 和 strace 类 似 ， 所 以 我 们 在 这 里 提 一 下 。 但 
是 它 不 跟踪 内 核 级 的 内 容 。 请 记 住 , 共享 库 调用 比 系统 调用 数量 多 得 多 。 所 以 你 有 必要 过 滤 ltrace 
命令 的 输出 结果 。1ltrace 命 令 有 很 多 选项 可 以 帮 到 你 。 


注解 ”有关 共 享 库 的 细节 可 参考 15.1.4 节 。1trace 命 令 对 静态 连接 二 进 制 库 无 效 。 


8.4 线程 


在 Linux 中 ， 一 些 进 程 被 细 分 为 更 小 的 部 分 ,我们 称 为 线程 ( thread )。 线 程 和 进程 很 类 似 ， 
它 有 一 个 标识 符 ( 即 TID )。 内 核 运行 线程 的 方式 和 运行 进程 基本 相同 。 但 有 一 点 不 同 ， 即 进程 之 
间 不 共享 内 存 和 IO 这 样 的 系统 资源 ， 而 同一 个 进程 中 的 所 有 线程 则 共享 该 进程 占用 的 系统 资源 
和 一 些 内 存 。 


8.4.1 单线 程 进程 和 多 线程 进程 


很 多 进程 只 有 一 个 线程 ， 叫 单线 程 进程 。 有 超过 一 个 线程 的 叫 多 线程 进程 。 所 有 进程 最 开始 
都 是 单线 程 , 起 始 线程 通常 称 为 主线 程 。 主 线程 随后 可 能 会 启动 新 的 线程 ， 这 样 进程 就 变 为 多 线 
程 。 这 个 过 程 和 进程 使 用 fork() 创 建新 进程 类 似 。 


注解 ”对 于 单线 程 的 进程 来 我 们 很 少 提 及 线程 。 本 书 中 除非 是 遇 到 某 些 特定 的 多 线程 进程 ， 否 
则 我 们 不 提 及 线程 一 说 。 


多 线程 的 主要 优势 在 于 , 当 进程 要 做 的 事情 很 多 时 , 多 个 线程 可 以 同时 在 多 个 处 理 需 上 运行 ， 
这 样 可 以 加 快 进程 的 运行 速度 。 虽 然 你 也 可 以 同时 在 多 个 处 理 器 上 运行 多 个 进程 , 但 线程 相对 进 
程 来 说 启动 更 快 , 并 且 线 程 间 通过 共享 的 进程 内 存 来 相互 通信 ， 比 进程 间 通 过 网 络 和 管道 相互 通 
信 更 加 便捷 高 效 。 

一 些 应 用 程序 使 用 线程 来 解决 在 管理 多 个 IO 资源 时 遇 到 的 问题 。 传 统 上 来 说 ， 进 程 有 时 候 
会 使 用 fork() 创 建新 的 子 进程 来 处 理 新 的 输入 输出 流 。 线 程 提供 相似 的 机 制 , 但 却 省 去 了 启动 新 
进程 的 麻烦 。 
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8.4.2 ”查看 线程 


默认 情况 下 , ps 和 top 命 令 只 显示 进程 的 信息 。 如 果 想 查看 线程 的 信息 , 可 以 添加 一 个 m 选 项 ， 
如 下 例 所 示 。 


例 8-1 使 用 ps m 查 看 线程 


$psm 
PID TTY STAT TIME COMMAND 

3587 pts/3 - 0:00 bashO 
号 Ss 0:00 - 

3592 pts/4  - 0:00 bash@ 
汪 Ss 0:00 - 

12287 pts/8 s 0:54 /usr/bin/python /usr/bin/gm-notify@ 
- - SL1 0:48 - 
oe SL1 0:00 - 
- - SL1 0:06 - 
SL1 0:00 - 


该 例 显示 进程 和 线程 的 信息 。 每 一 行 有 一 个 PID 字 段 ( 其 中 @@、@、@@ 行 的 PID 值 是 数字 )， 
代表 一 个 进程 ， 和 一 般 的 ps 输出 一 样 。PID 字 上 段 值 为 -的 那些 行 代表 进 程 中 的 线程 。 本 例 中 进程 @ 
和 人 @ 只 有 一 个 线程 ， 进 程 @( PID 值 为 12287 ) 有 四 个 线程 。 

如 果 想 要 使 用 ps 查看 TID, 需要 使 用 自 定义 的 输出 格式 。 下 面 的 例子 显示 PID、TID 以 及 相关 


命令 。 


例 8-2 ”使 用 ps m 查 看 PID 和 TID 


$ ps m -o pid,tid,command 
PID TID © COMMAND 


3587 - bash 
- 3587 - 
3592 - bash 
92 .全 
12287 - /usr/bin/python /usr/bin/gm-notify 
- 12287 加 
- 12288 
- 12289 
- 12295 


例 8-2 中 显示 的 线程 和 例 8-1 中 的 相对 应 。 请 注意 , 单线 程 进程 中 的 TID 和 PID 相 同 , 即 主线 程 。 
对 于 多 线程 进程 12287， 线 程 12287 是 主线 程 。 


注解 ”和 进程 不 同 ， 通 常 你 不 会 和 线程 进行 交互 。 要 和 多 线程 应 用 中 的 线程 打交道 ， 你 需要 对 
该 应 用 的 具体 实现 非常 了 解 ， 即 使 这 样 ， 我 们 也 不 推荐 这 种 方式 。 


就 资源 监控 而 言 , 线程 可 能 会 带 来 一 些 麻烦 ,因为 在 多 线程 进程 中 ,多 个 线程 可 能 同时 占用 
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资源 。 例 如 ，top 默 认 情 况 下 不 显示 线程 ,你 需要 按 H 键 来 显示 线程 。 我们 马上 将 要 介绍 很 多 资源 
监控 工具 ， 它 们 需要 一 些 额 外 的 步 又 来 打开 线程 显示 功能 。 


8.5 资源 监控 简介 


现在 我 们 来 介绍 一 下 资源 监控 ， 包括 CPU 时 间 、 内 存 和 磁盘 1/O。 我 们 将 从 系统 和 进程 两 个 
层面 来 了 解 。 

很 多 人 为 了 提高 性 能 去 深入 了 解 Linux 内 核 。 然而， 大 部 分 Linux 系 统 在 默认 配置 下 性 能 都 不 
错 , 很 有 可 能 你 花 了 很 多 时 间 来 优化 系统 , 但 实际 效果 甚 微 。 特 别 是 在 你 对 系统 没有 足够 了 解 的 
时 候 更 是 如 此 。 所 以 , 与 其 使 用 各 种 工具 来 尝试 性 能 优化 ,不 如 来 看 看 内 核 如 何在 进程 之 间 分 配 


8.6 测量 CPU 时 间 


如 果 要 监控 进程 ， 可 以 使 用 top 命 令 加 -p 选 项 ， 如 下 所 示 : 


$ top -p pzdz /-p pid? ...] 


使 用 time 命 令 可 以 查看 命令 整个 执行 过 程 中 占用 的 CPU 时 间 。 大 部 分 shell 提 供 的 time 命 令 只 
显示 一 些 基本 信息 ， 所 以 你 可 能 需要 运行 /usr/bin/time。 例 如 ， 如 果 要 查看 1s 命 令 占 用 的 CPU 
时 间 ， 可 以 运行 以 下 命令 : 


$ /usr/bin/time 1s 


time 在 1s 结 束 后 会 显示 像 下 面 这 样 的 结果 ， 关 键 的 字段 我 们 使 用 粗 体 字 标 出 : 


0.05user 0.09system 0:00.44elapsed 31%CPU (0avgtext+0avgdata Omaxresident)k 
Ooinputs+Ooutputs (125major+51minor)pagefaults Oswaps 


其 中 三 个 关键 字段 分 别 代表 以 下 含义 。 

D user: 用 户 时 间 , 指 CPU 用 来 运行 程序 代码 的 时 间 ， 以 秒 为 单位 。 在 现在 的 处 理 器 中 , 命 

令 的 运行 速度 很 快 ， 有些 不 超过 一 秒 ，time 命 令 会 将 它们 四 舍 五 入 为 0。 

口 system: 系统 时 间 ， 指 内 核 用 来 执行 进程 任务 的 时 间 〈 例如 读 取 文件 和 目录 )。 

口 elapsed: 消耗 时 间 ， 指 进程 从 开始 到 结束 所 用 的 全 部 时 间 ,， 包括 CPU 执 行 其 他 任务 的 时 
间 。 这 个 数字 在 检测 性 能 方面 不 是 很 有 帮助 ， 不 过 将 消耗 时 间 减 去 用 户 时 间 和 系统 时 间 
所 剩余 的 时 间 ， 能 够 让 你 得 知 进程 等 待 系统 资源 所 消耗 的 时 间 。 

输出 结果 中 的 其 余部 分 是 有 关内 存 和 IO 使 用 的 内 容 。 在 8.9 节 中 ， 我 们 会 讲解 关于 页 面 错误 
输出 的 内 容 。 
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8.7 ”调整 进程 优先 级 


你 可 以 更 改 内 核对 进程 的 调度 方式 ， 从 而 增加 或 减少 安排 给 进程 的 CPU 时 间 。 内 核 按照 每 个 


进程 的 调度 优先 级 来 运行 进程 , 这 些 优先 级 用 -20 和 20 之 间 的 数字 表示 。 有 些 古 怪 的 是 , -20 是 最 


高 的 优先 级 。 


ps -1 命令 显示 当前 进程 的 优先 级 ， 不 过 使 用 top 命 令 更 容易 一 点 ， 如 下 所 示 。 


$ top 


Tasks: 244 total, 2 running, 242 sleeping, 0 stopped, 0 zombie 

Cpu(s): 31.7%us, 2.8%sy, 0.0%ni, 65.4%id, 0.2%wa, 0.0%hi, 0.0%si, 0.0%st 
Mem: 6137216k total, 5583560k used, 553656k free, 72008k buffers 

Swap: 4135932k total, 694192k used, 3441740k free, 767640k cached 


PID USER PR 


28883 bri 20 
1175 root 20 
4022 bri 20 
4029 bri 20 
3971 bri 20 
5378 bri 20 
3821 bri 20 
4117 bri 20 
4138 bri 20 
4274 bri 20 
4267 bri 20 
2327 bri 20 


NI 


0 
0 
0 
0 
0 
0 
0 
0 
0 
0 
0 
0 


VIRT 


1280m 


210m 
413m 
378m 
881m 
152m 
312m 
321m 
331m 
232m 


1102m 


301m 


SHR 
32m 
28m 
28m 
19m 
32m 


7064 


14m 
18m 
21m 
13m 
11m 
16m 


S %CPU %MEM 


5S 
R 
$ 
9 
S$ 
5 
9 
S 
9 
S$ 
9 
S 


> 
OPPPPOOmNUWLWDO 


DODDODDDDFNP 


TIME+ COMMAND 


.65 
:35 
:13 
.86 
.88 
.21 
.57 
.01 
.19 
.78 
:59. 
:55. 


27 
65 


chromium-browse 
Xorg 
chromium-browse 
chromium-browse 
chromium-browse 
compiz 
soffice.bin 
chromium-browse 
chromium-browse 
chromium-browse 
chromium-browse 
unity-2d-shell 


上 面 的 输出 结果 中 ，PR ( 意思 是 优先 级 ) 字段 显示 内 核 当 前 赋予 进程 的 调度 优先 级 。 这 个 数 


字 越 大 ， 内 核 调 月 


先 级 在 进程 执行 过 程 中 也 会 根据 其 消耗 的 CPU 时 间 而 频繁 改变 。 


PR 字段 旁边 是 NI ( 意思 是 优先 值 ) 字段 ， 显示 有 关内 核 进程 调度 的 少许 信 
内 核 的 进程 调度 ， 这 个 信息 会 对 你 有 用 。 内 核 使 用 NI 值 来 决定 进程 下 一 次 在 什么 时 


NI 默认 值 是 0。 例 如 ， 你 在 后 台 运行 一 个 计算 量 很 大 的 进程 ， 且 不 希望 它 


想 让 它 在 其 他 进程 空闲 的 时 候 再 运行 ， 就 可 以 使 用 renice 命 令 将 NI 设置 为 20 (pid 是 你 要 设置 的 


进程 的 ID ): 


上 该 进程 的 几率 越 小 。 决 定 内 核 分 配给 进程 CPU 时 间 的 不 仅仅 是 优先 级 ,并 且 优 


[1 果 你 想 干预 


响 到 前 合 的 交互 ， 


$ renice 20 pid 


如 果 你 是 超级 月 


有 户 , 你 可 以 将 NI 设置 为 一 个 负数 , 但 这 并 不 是 一 个 好 方法 ， 因 为 系统 级 进程 


也 许 无 法 获得 足够 的 CPU 时 间 。 事 实 上 ， 你 可 能 根本 就 不 需要 自己 设置 NI 值 ， 因 为 Linux 系 统 大 


多 时 候 是 单个 月 


要 得 多 。 ) 


有 户 在 使 用 ， 所 以 没有 太 多 竞争 。( 从 前 多 个 月 


图 灵 社 区 会 员 小 虎 (164142021@qq.com) 专 享 尊重 版 权 


有 户 使 用 一 个 系统 的 时 候 ，NI 值 训 


it 重 


8.8 平均 负载 145 


8.8 平均 负载 


CPU 的 性 能 比较 容易 来 衡量 。 平 均 负 载 (load average ) 是 准备 就 绪 待 执行 的 进程 的 平均 数 。 
也 就 是 某 一 时 刻 可 以 使 用 CPU 的 进程 数 的 一 个 估计 值 。 系 统 中 大 多 数 进程 通常 把 时 间 花 在 等 待 输 
入 上 《如 从 键盘 、 鼠 标 、 网 络 等 )， 这 意味 着 这 些 进 程 没有 准备 就 绪 可 执行 ， 所 以 并 不 计 入 平均 
负载 。 只 有 那些 真正 在 运行 的 进程 才 计 入 平均 负载 。 


8.8.1 uptime 的 使 用 


uptime 命 令 显 示 三 个 平均 负载 值 和 内 核 已 经 运行 的 时 长 : 


$ uptime 
.. Up 91 days, ... load average: 0.08, 0.03, 0.01 


以 上 三 个 粗 体 数字 分 别 代表 过 去 1 分 钟 、5 分 钟 和 15 分 钟 的 平均 负载 值 。 如 你 所 见 ， 系 统 
并 不 很 繁忙 : 过 去 15 分 钟 只 有 平均 数目 为 0.01 的 进程 在 运行 。 也 就 是 说 ,如 果 你 只 有 一 个 处 理 
带 , 它 过 去 15 分 钟 只 运行 了 用 户 空间 应 用 的 1%。( 一 般 来 说 , 大 部 分 桌面 系统 的 平均 负载 为 0， 
除非 你 在 编译 程序 或 者 玩 游 戏 。 平 均 负 载 为 0 通常 是 一 个 好 迹象 ， 说 明 CPU 不 是 很 已 ， 系 统 很 
省 电 。) 


注解 ”目前 桌面 系统 的 用 户 界 面 组 件 比 以 往 占用 更 多 的 CPU。 例如 在 Linux 系 统 上 ，Web 浏 览 器 
的 Flash 插 件 可 能 消耗 很 多 资源 ， 一 些 问 脚 的 Flash 应 用 动 辆 占用 大 量 的 CPU 和 和 内存 。 


如 果 平 均 负载 值 接 近 1， 说 明 某 个 进程 可 能 完全 占用 了 CPU。 这 时 可 以 使 用 top 命 令 来 查看 ， 
通常 出 现在 列表 最 上 方 的 就 是 那个 进程 。 
现在 很 多 系统 有 多 个 处 理 咒 核心 〈 或 CPU )， 它 们 使 得 进程 能 够 同时 和 运行。 如 果 你 有 两 个 核 
心 并 且 平 均 负 载 为 1, 这 意味 着 只 有 其 中 一 个 处 于 活路 状态， 如 采 平均 负载 为 2, 说 明 两 个 都 处 于 


8.8.2 ”高 负载 


平均 负载 值 高 并 不 一 定 表 示 系 统 出 现 了 问题 。 系 统 如 果 有 足够 的 内 存 和 IO 资源 可 以 运行 许 
多 进程 。 如 果 平 均 负载 值 高 的 同时 系统 响应 速度 还 很 快 ， 就 不 需要 大 担心 , 这 说 明 系 统 中 有 很 多 
进程 在 共享 CPU。 进 程 间 需 要 相互 竞争 CPU 时 间 ， 如 果 它 们 放任 其 他 进程 长 时 间 占 有 CPU， 它 们 
自身 的 运行 时 间 就 会 大 大 增长 。 对 于 Web 服 务 器 来 说 ， 高 平均 负载 值 也 是 正常 现象 ， 因 为 进程 启 
动 和 结束 得 很 快 ， 以 至 于 平均 负载 检测 机 制 无 法 获得 有 效 的 数据 。 

然而 ， 如 果 平 均 负 载 值 高 并 且 系统 响应 速度 很 慢 的 话 ， 可 能 意味 着 内 存 性 能 有 问题 。 当 系统 
出 现 内 存 不 足 的 情况 时 , 内核 会 开始 执行 一 个 机 械 性 的 反复 动作 , 或 者 说 在 磁盘 和 内 存 间 交换 进 
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程 数 据 。 此 时 很 多 进程 会 处 于 执行 准备 就 绪 状 态 , 但 是 可 能 没有 足够 内 存 。 这 种 情况 下 ， 它们 保 
持 准 备 就 绪 状 态 的 时 间 要 比 平时 久 一 些 。 
下 面 让 我 们 了 解 一 些 有 关内 存 的 详细 内 容 。 


8.9 内存 


查看 系统 内 存 状态 最 简单 的 方法 之 一 是 使 用 free 命 令 , 或 者 查看 /proc/meminfo 文 件 来 了 解 系 
统 内 存 被 作为 缓存 和 缓冲 区 的 实际 使 用 情况 。 我 们 前 面 介绍 过 ， 内 存 不 足 可 能 会 导致 性 能 问题 。 
如 果 没 有 足够 内 存 用 作 缓 存 和 缓冲 区 (被 其 他 程序 占用 ) 的 话 , 也 许 你 需要 考虑 增加 内 存 。 不过， 
把 所 有 的 性 能 问题 都 轻易 归咎 于 内 存 不 足 也 是 不 可 取 的 。 


8.9.1 内 存 工作 原理 


我 们 在 第 1 章 介绍 过 ，CPU 通 过 MMU ( 内 存 管 理 单元 ) 将 进程 使 用 的 虚拟 地 址 转换 为 实际 的 
内 存 地 址 。 内 核 帮 助 MMU 把 进程 使 用 的 内 存 划分 为 更 小 的 区 域 ， 我 们 称 为 页 面 。 内 核 负责 维 护 
一 个 数据 结构 ,我 们 称 为 页 面 表 ， 其 中 包含 从 虚拟 页 面 地 址 到 实际 内 存 地 址 的 映射 关系 。 当 进程 
访问 内 存 时 ，MMU 根 据 此 表 将 进程 使 用 的 虚拟 地 址 转换 为 实际 的 内 存 地 址 。 

进程 执行 时 并 不 需要 立即 加 载 它 所 有 的 内 存 页 面 。 内 核 通常 在 进程 需要 的 时 候 加 载 和 分 配 内 
存 页 面 ， 我 们 称 为 按 需 内 存 分 页 ( on-demand paging 或 者 demand paging )。 要 了 解 它 的 工作 原理 ， 
让 我 们 来 看 一 看 进程 是 如 何 启动 和 运行 的 。 

(1) 内 核 将 程序 指令 代码 的 开始 部 分 加 载 到 内 存 页 面 内 。 

(2) 内 核 可 能 还 会 为 新 进程 分 配 一 些 内 存 页 面 供 其 运行 使 用 。 

(3) 进程 执行 过 程 中 ， 可 能 代码 中 的 下 一 个 指令 在 已 加 载 的 内 存 页 面 中 不 存在 。 这 时 内 核 接 
管控 制 ， 加 载 需要 的 内 存 页 面 ， 然 后 让 程序 恢复 运行 。 

(4) 同样 地 ， 如 果 进 程 需要 使 用 更 多 的 内 存 ， 内 核 接 管控 制 ， 并 且 获 得 空闲 的 内 存 空间 (或 
者 腾 出 一 些 内 存 空 间 ) 分 配给 进程 。 


8.9.2 内存 页 面 错误 


如 果 内 存 页 面 在 进程 想 要 使 用 时 没有 准备 就 绕 ， 进 程 会 产生 内 存 页 面 错误 (page fault )。 错 
误 产生 时 ， 内 核 从 进程 接管 CPU 的 控制 权 ， 然 后 使 内 存 页 面 准备 就 绪 。 内 存 页 面 错误 有 两 种 : 轻 
微 错误 和 严重 错误 。 

轻微 内 存 页 面 错误 

进程 需要 的 内 存 页 面 在 主 内 存 中 但 是 MMU 无 法 找到 时 ， 会 产生 轻微 内 存 页 面 错误 。 通 常 发 
生 在 进程 需要 更 多 内 存 时 ,或 MMU 没 有 足够 内 存 空 间 来 为 进程 存放 所 有 页 面 时 。 这 时 内 核 会 通 
知 MMU, 并 且 让 进程 继续 执行 。 轻 微 内 存 页 面 错 误 不 是 很 严重 ,在 进程 执行 过 程 中 可 能 会 出 现 。 
通常 你 不 需要 对 此 太 在 意 ， 除 非 是 那些 对 性 能 和 内 存 要 求 很 高 的 应 用 。 
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严重 内 存 页 面 错误 

严重 内 存 页 面 错误 发 生 在 进程 需要 的 内 存 页 面 在 主 内存 中 不 存在 时 , 意味 着 内 核 需要 从 磁盘 
或 者 其 他 低速 存储 媒介 中 加 载 。 太 多 此 类 错误 会 影响 系统 性 能 ,因为 内 核 必须 做 大 量 的 工作 来 为 
进程 加 载 内 存 页面 ， 占 用 大 量 CPU 时 间 ， 妨 碍 其 他 进程 的 运行 。 

有 一 些 严重 内 存 页 面 错误 是 不 可 避免 的 ， 例 如 你 第 一 次 运行 某 个 程序 并 从 磁盘 加 载 代 码 时 ， 
很 可 能 会 发 生 这 种 情况 。 如 果 你 陷入 了 内 存 不 足 的 状况 ， 且 内 核 开 始 在 内 存 和 磁盘 间 交 换 页 面 ， 
以 为 新 页 面 腾 出 空间 ， 这 就 是 比较 玉手 的 情况 了 。 

查看 内 存 页 面 错 误 

你 可 以 使 用 ps 、top 或 time 命 令 为 某 个 进程 的 内 存 页 面 错误 查找 原因 。 下 面 是 一 个 例子 ， 列 
举 time 命 令 提供 的 内 存 页 面 错误 信息 。( cal 命 令 的 输出 可 以 忽略 ， 我 们 将 其 重 定向 到 /devwnull。) 


$ /usr/bin/time cal > /dev/null 
0.00user 0.00system 0:00.06elapsed 0%CPU (0avgtext+0avgdata 3328maxresident)k 
648inputs+0outputs (2major+254minor)pagefaults Oswaps 


从 以 上 加 粗 的 信息 可 以 看 出 ， 程 序 运行 过 程 中 产生 了 两 个 严重 内 存 页 面 错误 和 254 个 轻微 内 
存 页 面 错 误 。 严重 内 存 页 面 错误 发 生 在 当 内 核 首次 从 磁盘 加 载 一 个 程序 的 时 候 。 如 果 再 次 运行 该 
程序 , 你 可 能 不 会 再 碰 到 严重 内 存 页 面 错误 ,因为 内 核 可 能 已 经 将 从 磁盘 加 载 的 内 存 页 面 放 人 组 
存 了 。 

如 果 你 想 在 进程 运行 过 程 中 查看 产生 的 内 存 页 面 错误 ， 可 以 使 用 top 或 者 ps 命令 。 可 以 使 用 
top 命 令 加 f 选 项 设置 显示 的 字段 , u 选 项 显示 严重 内 存 页 面 错误 的 数目 。( 结果 会 显示 在 一 个 新 的 
列 nFLT 中 ， 轻 微 内 存 页 面 错误 不 显示 。) 

使 用 ps 命令 时 , 你 可 以 使 用 自 定 义 输出 格式 来 查看 某 个 进程 产生 的 内 存 页 面 错 误 。 下 面 是 进 
程 20365 的 一 个 例子 : 


$ ps -o pid,min flt,maj_flt 20365 
PID MINFL MAJFL 
20365 834182 23 


MINFL 和 MAJFL 列 显示 轻微 和 严重 内 存 页 面 错误 数目 。 在 此 基础 上 ， 你 还 可 以 加 入 其 他 的 进程 
选择 参数 ， 请 参见 帮助 手册 ps(1)。 

查看 内 存 页 面 错 误 能 够 帮助 你 定位 出 现 问 题 的 组 件 。 如 果 你 对 整个 系统 的 性 能 感 兴趣 ,你 需 
要 一 个 对 所 有 进程 的 CPU 和 内 存 性 能 进行 监控 汇总 的 工具 。 


8.10 ”使 用 vmstat 监控 CPU 和 内 存 性 能 


在 众多 系统 性 能 监控 工具 中 ，vmstat 命 令 是 较为 陈旧 的 一 个 , 但 也 是 运行 开销 最 小 的 一 个 。 
你 可 以 使 用 它 来 清晰 地 了 解 内 核 交换 内 存 页 面 的 频率 、CPU 的 繁忙 程度 以 及 IO 的 使 用 情况 。 
通过 查看 vmstat 的 输出 结果 能 够 获得 很 多 有 用 的 信息 。 下 面 是 vmstat 2 命令 的 输出 结果 ， 统 
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计 信 息 每 2 秒 刷 新 一 次 : 


$ vmstat 2 

procs ----------- memory---------- ---Swap-- -----io---- -System-- ---- cpu---- 
T b swpd free buff cache si so bi bo in cs us sy id wa 
2 0 320416 3027696 198636 1072568 于 2 0 15 2 83 

2 0 320416 3027288 198636 1072564 1182 407 636 1099 

1 0 320416 3026792 198640 1072572 58 281 537 10 99 
0 0 320416 3024932 198648 1074924 318 541 0 0 99 
0 0 320416 3024932 198648 1074968 0 208 416 0099 
0 0 320416 3026800 198648 1072616 0 207 389 0 0 100 0 


OOO OS 
总 已 已 已 所 局 
DODDODeDeD 
Wu 

© 

Oo 
OPOoODCO 


输出 结果 可 以 归 为 这 几 类 : procs ( 进程 )、memory ( 内 存 使 用 )、swap( 内 存 页 面 交 换 )、io 
(磁盘 使 用 )、system ( 内 核 切 换 到 内 核 代 码 的 次 数 ) 以 及 cpu ( 系统 各 组 件 使 用 CPU 的 时 间 )。 

上 例 中 的 输出 结果 是 系统 负载 不 大 的 一 种 典型 情况 。 通常 我 们 会 从 第 二 行 看 起 ,因为 第 一 行 
是 系统 整个 运行 时 期 的 平均 值 。 上 例 中 ， 系 统 有 320 416 KB 内 存 被 交换 到 磁盘 ( swpd )， 有 大 约 
3 025 000KB (3 GB ) 空闲 内 存 (free )。 虽 然 有 一 部 分 交换 空间 正在 被 占用 ,但 是 si ( 换 入 ， 
swap-in ) 和 so ( 换 出 ，swap-out ) 列 仍 显示 内 核 没 有 在 磁盘 交换 内 存 。buff 列 显示 内 核 用 于 磁盘 
缓冲 区 的 内 存 ( 可 参考 4.2.5 节 )。 

在 最 右边 的 cpu 列 ， 你 可 以 看 到 CPU 时 间 被 分 为 us 、sy、id 和 wa 列 。 它 们 依次 代表 用 户 任 务 、 
系统 ( 内核 ) 任务 、 空 闲 时 间 和 IO 等 待 时 间 占 用 的 CPU 时 间 的 百分比 。 上 例 中 运行 的 用 户 进 程 
不 多 (只 占用 了 最 多 1% 的 CPU 时 间 )， 而 内 核 基 本 上 是 空闲 的 ，CPU 99% 的 时 间 均 为 空闲 。 

现在 让 我 们 来 看 看 一 个 庞大 的 程序 启动 后 会 发 生 什么 情况 ( 前 两 行 显示 的 是 程序 开始 运行 前 
一 刻 的 信息 ): 


例 8-3 ”内 存活 动 


procs ----------- memory-------- --- Swap-- -----io---- -System-- ---- cpu---- 
rb swpd free buff cache si so bi bo jin cs us sy id wa 
1 0 320412 2861252 198920 1106804 0 0 0 0 2477 4481 25 2 72 0 
1 0 320412 2861748 198924 1105624 0 0 0 40 2206 3966 26 2 72 0 
1 0 320412 2860508 199320 1106504 0 0 210 18 2201 3904 26 2 71 1 
1 1 320412 2817860 199332 1146052 0 0 19912 0 2446 4223 26 3 63 8 


2 2 320284 2791608 200612 1157752 202 0 4960 854 3371 5714 27 3 51 18@ 
1 1 320252 2772076 201076 1166656 10 0 2142 1190 4188 7537 30 3 53 14 
0 3 320244 2727632 202104 1175420 20 0 1890 216 4631 8706 36 4 46 14 


例 8-3 中 的 @ 显 示 ，CPU 在 一 段 时 间 内 开始 出 现 一 定 的 使 用 量 ， 特 别 是 针对 用 户 进 程 。 因 为 
可 用 内 存 充足 ， 在 内 核 越 来 越 多 使 用 磁盘 的 时 候 ， 绥 存 和 绥 冲 空间 的 使 用 量 开始 增 大 。 

随后 我 们 看 到 一 个 有 趣 的 现象 : 名 显示 内 核 将 一 些 被 交换 出 〈 si 列 ) 磁盘 的 内 存 页 面 加 载 到 
内 存 中 。 这 表示 刚刚 运行 的 程序 有 可 能 使 用 了 一 些 和 其 他 进程 共享 的 内 存 页 面 。 这 种 情况 很 常见 ， 
很 多 进程 只 有 在 启动 时 会 使 用 到 一 些 共 享 库 代码 。 

请 注意 在 b 列 中 有 一 些 进 程 在 等 待 内 存 页 面 时 被 阻 断 ( 即 被 阻止 运行 )。 简单 说 就 是 可 用 内 存 
在 减少 , 但 是 还 未 耗 尽 。 上 例 中 还 有 一 些 磁盘 相关 的 进程 , 从 bi 和 bo 列 不 断 增 大 的 数字 可 以 看 出 。 
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在 内 存 耗 尽 的 时 候 , 输出 结果 则 大 为 不 同 。 内 存 耗 尽 时 , 因为 内 核 需要 为 用 户 进程 分 配 内 存 ， 
缓冲 区 和 缓存 空间 开始 减少 。 一 旦 内 存 耗 尽 ， 内 核 开 始 将 内 存 页 面 交 换 到 磁盘 , 在 so 列 中 会 开始 
出 现 进程 ， 此 时 其 他 列 的 信息 会 相应 变更 。 系 统 时 间 值 会 变 大 ， 数 据 交换 更 频繁 ， 更 多 的 进程 处 
于 阻 断 状态 ， 因 为 它们 所 需 的 内 存 不 可 用 (已 经 被 交换 出 磁盘 )。 

我 们 还 未 介绍 完 vmstat 的 所 有 输出 列 。 你 可 以 查看 vmstat(8) 帮 助手 册 以 获得 更 详细 的 文档 。 
不 过 建议 你 先 从 Operating System Concepts, 9th Edition ( Wiley，2012 ) 这 类 书 或 者 其 他 渠道 学 习 
内 核 内 存 管理 方面 的 知识 。 


8.11 IO 监控 


默认 情况 下 ，vmstat 显 示 常 用 的 IO 统计 信息 。 虽 然 你 可 以 使 用 vmstat -d 获 得 十 分 详细 的 资 
源 使 用 情况 ， 但 这 一 选项 的 输出 信息 十 分 庞大 ， 会 让 人 有 些 抓 狂 。 我 们 可 以 从 专门 针对 IO 的 命 
今 iostat 看 起 。 


8.11.1 使 用 iostat 


和 vmstat 类 似 ，iostat 在 不 带 任何 参数 时 显示 系统 当前 的 运行 时 间 信 息 : 


$ iostat 

[kernel information] 

avg-cpu: Xuser %nice %system %iowait %steal  %idle 
4.46 0.01 0.67 0.31 0.00 94.55 


Device: tps kB_read/s kB_wrtn/s kB_read kB_wrtn 
sda 4.67 7.28 49.86 9493727 65011716 
sde 0.00 0.00 0.00 1230 0 


上 面 avg-cpu 部 分 和 本 章 介绍 的 其 他 工具 一 样 ， 显 示 的 是 CPU 的 使 用 信息 ， 往 下 是 各 个 设备 
的 情况 ， 如 下 所 示 。 
口 tps: 平均 每 秒 数据 传输 量 。 
口 kB_read/s: 平均 每 秒 数据 读 取 量 。 
口 kB_wrtn/s: 平均 每 秒 数据 写 人 量 。 
口 kB_read: 数据 读 取 总 量 。 
D kB_wrtn: 数据 写 人 总 量 。 

iostat 和 vmstat 的 另 一 个 相似 之 处 是 你 可 以 设 定 一 个 间隔 选项 ， 如 iostat 2， 这 样 可 以 每 隔 2 
秒 更 新 一 次 信息 。 间 隔 参数 可 以 和 -d 选 项 配合 使 用 ， 意 思 是 只 显示 和 设备 相关 的 信息 (如 iostat 
-d 2 )。 
默认 情况 下 ，iostat 的 输出 结果 不 包含 分 区 信息 。 如 果 要 显示 分 区 信息 ， 可 以 使 用 -p ALL 选 
项 。 因 为 典型 的 系统 上 都 会 有 很 多 分 区 ， 所 以 输出 的 信息 量 也 会 很 大 。 下 面 是 部 分 输出 示例 : 
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$ iostat -p ALL 


--Snip 

--Device: tps kB_read/s kB_wrtn/s kB_read kB_wrtn 
-- Snip- 

sda 4.67 7.27 49.83 9496139 65051472 
sdal 4.38 7.16 49.51 9352969 64635440 
sda2 0.00 0.00 0.00 6 0 
sda5 0.01 0.11 0.32 141884 416032 
scdo 0.00 0.00 0.00 0 0 
-- Snip-- 

sde 0.00 0.00 0.00 1230 0 


上 例 中 ，sdal 、sda2 和 sda5 均 为 sda 磁 盘 上 的 分 区 ， 因 而 读 和 写 两 列 的 信息 可 能 会 有 重合 。 然 
而 各 分 区 的 总 和 并 不 一 定 等 于 磁盘 的 总 容量 ,虽然 对 sdal 的 读 取 同时 也 是 对 sda 的 读 取 , 但 请 注意 ， 
从 sda 直 接 读 取 数 据 也 是 可 能 的 ， 比 如 读 取 分 区 表 数 据 。 


8.11.2 ”使 用 iotop 查 看 进程 的 |/O 使 用 和 监控 


如 果 想 要 更 深入 地 了 解 各 个 进程 对 WO 资源 的 使 用 情况 , 可 以 使 用 iotop 工 具 , 使 用 方法 和 top 
一 样 。 它 会 持续 显示 使 用 1/O 最 多 的 进程 ， 最 顶端 是 汇总 数据 ， 如 以 下 代码 所 示 。 


# iotop 
Total DISK READ: 4.76 K/s | Total DISK WRITE: 333.31 K/s 

TID PRIO USER DISK READ DISK WRITE SWAPIN IO> COMMAND 

260 be/3 root 0.00 B/s 38.09 K/s 0.00 % 6.98 % [jbd2/sda1-8] 

2611 be/4 juser 4.76 K/s 10.32 K/s 0.00 % 0.21 % zeitgeist-daemon 
2636 be/4 juser 0.00 B/s 84.12 K/s 0.00 % 0.20 % zeitgeist-fts 

1329 be/4 juser 0.00 B/s 65.87 K/s 0.00 % 0.03 % soffice.b~ash-pipe=6 
6845 be/4 juser 0.00 B/s 812.63 B/s 0.00 % 0.00 % chromium-browser 
19069 be/4 juser 0.00 B/s 812.63 B/s 0.00 % 0.00 % rhythmbox 


请 注意 ， 除 了 user 、command、read、write 列 之 外 ， 还 有 一 列 叫 TID( 也 就 是 线程 ID )， 而 非 
PID( 即 进程 ID )。iotop 是 为 数 不 多 的 显示 线程 而 非 进 程 的 工具 。 
PRIO ( 意思 是 优先 级 ) 列表 示 IO 的 优先 级 。 它 类 似 于 我 们 介绍 过 的 CPU 优先 级 ,但 它 还 会 决 
定 内 核 为 进程 调度 1/O 读 写 操作 分 配 多 长 时 间 。 如 果 优 先 级 为 be/4， 则 be 代表 调度 等 级 ,数字 代表 
优先 级 别 。 和 CPU 优 先 级 一 样 ， 数 字 越 小 ， 优 先 级 越 高 。 比 如 内 核 会 为 be/3 的 进程 分 配 比 be/4 的 
进程 更 多 的 时 间 。 
内 核 使 用 调度 等 级 为 JO 调 度 施 加 更 多 的 控制 。iotop 中 有 以 下 三 种 调度 等 级 。 
口 be: 即 bestreffort (尽力 )。 内 核 尽 最 大 努力 为 其 公平 地 调度 MO。 大 部 分 进程 是 在 这 类 IO 
调度 等 级 下 运行 。 
口 rt: 即 real-time (实时 )。 内 核 优 先 调度 实时 IO。 
D idle: 空闲 。 内 核 只 在 没有 其 他 IO 工作 的 时 候 安 排 此 类 IO 工作 。 该 调度 等 级 不 具备 优先 级 。 
你 可 以 使 用 ionice 工 具 来 查看 和 更 改进 程 的 MO 优先 级 ， 也 可 以 参考 ionice() 帮 助手 册 。 但 一 
般 情 况 下 你 不 用 关心 JO 优 先 级 。 
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8.12 ”使 用 pidstat 监控 进程 


我 们 已 经 介绍 过 如 何 使 用 top 和 iotop 来 监 探 进程。 但是， 它们 都 会 不 断 刷 新 输出 结果 ， 旧 的 
输出 会 被 新 的 覆盖 。pidstat 工 具 能 够 让 你 使 用 vmstat 的 方式 来 查看 进程 在 过 去 某 个 时 间 有 段 内 的 
资源 使 用 情况 。 下 例 是 对 进程 1329 监 控 结果 ， 按 秒 记 录 。 


$ pidstat -p 1329 1 


Linux 3.2.0-44-generic-pae (duplex) 07/01/2015 _i686 (4 CPU) 
09:26:55 PM PID %usr %system %guest %CPU CPU Command 

09:27:03 PM 1329 8.00 0.00 0.00 8.00 1 myprocess 
09:27:04 PM 1329 0.00 0.00 0.00 0.00 3 myprocess 
09:27:05 PM 1329 3.00 0.00 0.00 3.00 1 myprocess 
09:27:06 PM 1329 8.00 0.00 0.00 8.00 3 myprocess 
09:27:07 PM 1329 2.00 0.00 0.00 2.00 3 myprocess 
09:27:08 PM 1329 6.00 0.00 0.00 6.00 2 myprocess 


该 命令 在 默认 情况 下 显示 用 户 时 间 和 系统 时 间 的 百分比 ,以 及 综合 的 CPU 时 间 百 分 比 , 还 显 
示 进 程 在 哪 一 个 CPU 上 运行 。( %guest 列 有 一 点 奇怪 ， 指 进程 在 虚拟 机 上 运行 时 间 的 百分比 。 除 
非 你 是 在 运行 虚拟 机 ， 否 则 可 以 忽略 它 。) 

虽然 pidstat 默 认 显 示 CPU 的 使 用 情况 ， 它 还 有 其 他 很 多 功能 。 例 如 我 们 可 以 使 用 -r 选 项 来 
监控 内 存 , 使 用 -d 选 项 来 监控 磁盘 。 你 可 以 自己 尝试 运行 一 下 ， 更 多 针对 线程 、 上 下 文 切 换 和 其 
他 本 音 所 涉及 内 容 的 选项 可 以 参考 pidstat(1) 帮 助手 册 。 


8.13 ”更 深入 的 主题 


针对 资源 监控 的 工具 有 很 多 ， 其 中 一 个 原因 是 资源 的 种 类 很 多 ， 不 同 资源 的 使 用 方式 不 同 。 
本 章 我 们 介绍 了 进程 、 进 程 中 的 线程 和 内 核 是 如 何 使 用 CPU、 内 存 和 IO 等 系统 资源 的 。 

另外 一 个 原因 是 系统 的 资源 是 有 限 的 , 考虑 到 性 能 , 系统 中 的 各 个 组 件 都 需要 尽 可 能 地 减少 
资源 消耗 。 过 去 很 多 用 户 共享 一 台 计 算 机 ,所 以 需要 保证 每 个 用 户 公 平地 获得 资源 。 现 在 的 桌面 
系统 都 是 单 人 使 用 , 但 是 其 中 的 进程 仍然 相互 竞争 以 获取 资源 。 高 性 能 的 网 络 服务 器 对 系统 资源 
监控 的 要 求 更 高 。 

有 关 资 源 监控 和 性 能 分 析 的 更 加 深入 的 主题 有 以 下 几 方 面 。 

口 sar ( 即 系统 活动 报告 ，System Activity Reporter ): sar 包 含 很 多 vmstat 的 持续 监控 功能 ， 
另外 还 记录 系统 资源 随时 间 使 用 情况 。sar 让 你 能 够 查看 过 去 某 一 时 刻 的 系统 状态 ， 这 在 
你 需要 查看 已 发 生 的 系统 事件 时 非常 有 用 。 

Dacct( 即 进程 统计 ): acct 能 够 记录 进程 以 及 它们 的 资源 使 用 情况 。 

D Quotas ( 即 配额 ): 你 可 以 将 某 些 系统 资源 限制 给 某 个 进程 或 用 户 使 用 。 可 以 到 
/etc/security/limits.conf 中 查看 一 些 CPU 和 内 存 选项 , 帮助 手册 中 也 有 limits.conf(5) 文 档 。 这 

是 PAM 的 一 个 特性 ， 只 适用 于 那些 通过 PAM 启 动 的 进程 ( 如 登录 shell )。 你 还 可 以 使 用 
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quota 来 限制 用 户 可 以 使 用 的 磁盘 空间 。 
如 果 你 对 系统 调度 尤其 是 系统 性 能 感 兴趣 , 可 以 参考 Brendan Gregg 所 著 Systems Performance: 
Enterprise and the Cloud ( Prentice Hall，2013 ) 一 书 。 
关于 网 络 监控 和 资源 使 用 ,我们 还 有 很 多 工具 未 介绍 。 在 使 用 这 些 工具 之 前 , 你 需要 先 了 解 
网 络 的 工作 原理 ， 我 们 将 在 下 一 章 介绍 。 
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网 络 与 配置 


网 络 能 实现 计算 机 之 间 的 连接 与 数据 收发 。 听 起 来 够 
简单 的 ， 但 想 理解 个 中 运作 原理 ， 你 要 先 弄 懂 下 面 两 个 基 
础 问题 。 


口 发 送 方 怎么 知道 要 发 往 哪里 ? 
口 接收 方 怎么 知道 接收 了 什么 ? 

而 答案 就 是 : 计算 机 会 用 一 系列 负责 接收 、 发 送 和 识别 数据 的 组 件 来 完成 这 个 过 程 。 这 些 组 
件 被 划分 在 不 同 的 组 ， 而 这 些 组 层 秋 起 来 才 形 成 一 套 完 整 的 系统 ， 叫 作 网 络 层 次 。Linux 内 核 处 
理 网 络 通信 的 方式 类 似 第 3 章 的 SCSI 子 系统 。 


所 在 。 因 此 ,本章 先 考 察 一 种 简单 的 分 层 。 你 将 学 到 如 何 查看 自己 的 网 络 设置 ， 而 当 你 明白 每 层 
的 工作 时 ， 你 就 可 以 学 习 如 何 为 自己 的 层次 做 配置 。 最 后 ， 你 会 接触 一 些 更 高 级 的 内 容 ， 比 如 
建立 自己 的 网 络 以 及 配置 防火 墙 。( 如 果 对 该 部 分 无 兴趣 ， 也 可 以 先 跳 过 ， 需 要 时 再 回头 看 。) 


9.1 网 络 基 础 


在 讲解 理论 之 前 ， 先 看 下 图 9-1 中 的 简单 网 络 。 

这 种 网 络 很 普遍 , 大 多 数 家 庭 和 小 型 办 公 室 都 是 这 样 配置 的 。 该 网 络 中 的 每 台 机 器 都 叫 作 主 
机 ， 它 们 都 能 与 路 由 器 相连 。 路 由 器 也 是 一 种 主机 ， 它 使 网 络 与 网 络 之 间 能 传输 数据 。 这 些 机 器 
(主机 A、B、C ) 和 路 由 器 组 成 了 一 个 局 域 网 (Local Area Network， 以 下 简称 LAN )。LAN 中 的 
连接 可 以 是 有 线 的 也 可 以 是 无 线 的 。 

中 的 路 由 需 还 连接 了 一 个 云 状 物 一 一 互联 网 。 因 此 LAN 上 的 机 器 能 通过 路 由 需 连 接 到 互联 
网 。 本 章 的 目标 之 一 就 是 解释 路 由 器 如 何 实现 这 种 连接 。 
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图 9-1 ”一 个 通过 路 由 器 连接 到 互联 网 的 典型 局 域 网 


下 面 先 从 LAN 中 安装 了 Linux 的 机 器 开始 ， 如 上 图 中 的 主机 A。 
数据 包 


数据 被 分 成 一 块 块 的 在 网 络 上 传输 ,每 一 块 叫 作 一 个 数据 包 (packet )。 包 中 分 为 两 部 分 : 关 
和 净 荷 。 头 含有 一 些 识别 信息 ， 如 发 送 方 、 接 收 方 以 及 基本 的 协议 。 净 荷 则 含有 实际 需要 传送 的 


数据 ， 如 HTMIL 或 图 片 数据 。 


分 包 使 主机 能 够 交 蔡 地 做 出 发 送 、 接 收 、 处 理 数 据 的 动作 ， 所 以 主机 之 间 看 似 能 同时 通信 。 


而 且 这 样 也 令 错 误 检 测 和 重 传 数据 更 方便 。 


大 多 数 情 况 下 ， 你 没 必要 担心 数据 包 的 解析 ， 因 为 操作 系统 带 有 这 样 的 功能 。 然而， 理解 数 


据 包 在 以 下 介绍 的 网 络 层次 中 扮演 什么 角色 还 是 有 用 的 。 


9.2 网络 层 次 


一 个 功能 完整 的 网 络 , 包含 一 整套 被 称 为 网 络 栈 的 网 络 层次 。— 典 型 的 互联 网 栈 ， 从 顶部 到 底 


部 如 下 所 示 。 


口 应 用 层 : 包含 应 用 间 、 服 务 器 间 的 交流 语言 一 一 通常 是 一 种 高 级 的 协议 。 一 般 有 超 文本 
传输 协议 ( Hypertext Transfer Protocol， 以 下 简称 HTTP， 用 于 Web )、 安 全 套 接 层 ( Secure 


Socket Layer， 以 下 简称 SSL )、 文 件 传输 协议 ( File Transfer Proto 
议 能 够 组 合 使 用 。 例 如 SSL 就 常 跟 HTTP 一 起 用 。 
口 传输 层 : 用 于 规定 应 用 层 的 数据 传输 形式 。 该 层 包 括 数 据 完整 怕 


col， 以 下 简称 FTP )。 协 


的 检查 、 端 口 功 能 以 及 


将 数据 分 包 ( 如 果 应 用 层 未 分 包 )。 传 输 控 制 协议 (Transmission Control Protocol， 以 下 简 
称 TCP ) 和 用 户 数据 报 协议 (User Datagram Protocol， 以 下 简称 UDP ) 是 传输 层 最 常见 的 


协议 。 这 层 有 时 也 被 称 为 协议 层 。 


口 网 络 层 或 网 际 层 : 规定 如 何 识 别 源 主机 和 目的 主机 。IP( 网际 协 议 ) 规定 了 互联 网 所 使 用 
的 包 传 输 规则 。 因 为 本 书 只 讨论 互联 网 ， 所 以 我 们 只 谈 及 IP。 然 而, 网络 分 层 就 是 为 了 做 
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到 与 硬件 无 关 ， 所 以 ， 你 可 以 在 同一 台 机 器 上 配置 不 同 的 网 际 层 ( 如 IP、IPv6、IPX、 
AppleTalk 等 ) 
口 物理 层 : 规定 如 何 通 过 物理 中 介 (如 以 太 网 、 调 制 调解 器 ) 发 送 原始 数据 。 这 层 有 时 也 
被 称 为 链 路 层 或 网 络 接口 层 。 
理解 网 络 栈 的 结构 是 很 重要 的 。 因 为 你 的 数据 在 到 达 目 的 地 之 前 ,至少 要 穿越 它 两 次 。 举 个 例 
子 , 若 你 要 在 图 9-1 中 从 主机 A 发 数据 到 主机 B， 你 的 字 节 会 经 历 主机 A 的 应 用 层 、 传 输 层 、 网 际 层 ， 
下 至 物理 层 ， 经 过 中 介 ， 然 后 再 由 下 至 上 穿越 主机 B 中 的 这 些 层 次 。 如 果 需 要 通过 路 由 器 发 送 到 互 
联网 上 的 其 他 主机 ， 那 途中 还 会 经 历 路 由 器 或 其 他 设备 中 的 网 络 层次 〈 这 里 的 层次 通常 少 些 )。 
有 时 一 些 层次 会 以 特别 的 方式 来 干涉 其 他 层 的 数据 , 因为 按 顺 序 地 经 历 各 层次 不 一 定 是 高 效 
的 做 法 。 例 如 ， 为 了 高 效 地 过 滤 和 转发 数据 ,一 些 以 往 只 负责 物理 层 的 设备 ， 现 在 也 会 去 检查 传 
输 层 和 网 际 层 的 数据 。( 现在 只 讲 基础 ， 你 还 不 用 担心 这 些 问题 。) 
下 面 看 看 Linux 机 需 如 何 连接 到 网 络 ， 以 解答 本 章 开 头 “发 送 方 怎么 知道 要 发 往 哪 里 ”的 问 
题 。 这 里 涉及 栈 底 的 物理 层 和 网 际 层 。 然 后 再 看 看 上 面 的 两 层 ， 以 解答 “接收 方 怎么 知道 接收 了 
什么 ”的 问题 。 


注解 ”也许 你 听 说 过 开放 系统 互 连 (OSI ) 参考 模型 ， 它 是 一 种 七 层 的 网 络 模型 ， 常 用 于 教学 和 
设计 网 络 。 但 我 们 这 里 只 提 到 直接 会 用 到 的 四 层 。 想 知道 更 多 分 层 方面 的 东西 ， 可 看 
Andrew S. Tanenbaum 和 David J Wetherall 所 著 的 Computer Networks, Sth edition ( Prentice 
Hall，2010 )。 


9.3 网 际 层 


物理 层 太 底层 了 ， 难 理解 ,不 如 从 网 际 层 讲 起 ， 这 上 比较 好 理解 。 我 们 现在 所 用 的 互联 网 ， 仍 
然 基于 网 际 协 议 第 四 版 (IPv4 )， 尚 未 彻底 推行 Pv6。 网 际 层 的 重点 之 一 就 是 ， 它 与 硬件 或 操作 
系统 无 关 ， 也 就 是 说 ， 你 能 使 用 任何 一 种 硬件 或 操作 系统 在 互联 网 上 收发 数据 包 。 

互联 网 的 拓扑 结构 是 无 中 心 的 。 它 由 更 小 的 网 络 一 一 子 网 构成 。 意 思 是 , 各 子 网 以 某 些 方式 
相连 。 如 图 9-1 的 LAN 就 是 一 个 子 网 。 

一 个 主机 可 以 置 于 不 止 一 个 子 网 中 。 正 如 你 在 9.1 节 看 到 的 ， 负 责 将 数据 从 一 个 子 网 送 到 另 
一 子 网 的 那 种 主机 叫 作 路 由 器 (也 叫 网 关 )。 

图 9-2 对 图 9-1 进 行 了 补充 ,将 该 LAN 标 识 为 一 个 子 网 ， 并 给 路 由 器 和 每 个 主机 标 上 了 网 络 地 
址 。 几 中 路 由 器 有 两 个 地 址 ， 一 个 用 于 本 地 子 网 的 10.23.2.1 和 另 一 个 用 于 互联 网 的 “上 行 地 址 ” 
( 这 个 地 址 在 这 里 并 不 重要 )。 我 们 先 看 下 那些 地 址 ， 以 及 子 网 的 标识 。 

互联 网 中 的 每 台 主机 至 少 各 有 一 个 形 如 a.b.c.d 的 数字 IP 地 址 ， 如 10.23.2.37。 这 种 记 法 叫 作 点 
分 四 组 序列 。 如 果 有 个 主机 连接 了 多 个 子 网 ， 它 在 每 个 子 网 中 都 至 少 有 一 个 IP 地 址 。 每 个 主机 的 
IP 地 址 在 互联 网 中 应 该 是 唯一 的 。 但 你 即将 看 到 , 在 专用 网 络 和 网 络 地 址 转换 (NAT ) 的 情况 中 ， 
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它 会 有 点 混乱 。 


(局 域 网 ) 


子 网 10.23.2.0/24 


10.23.2.132 


| 


图 9-2 ” 带 有 IP 地 址 的 网 络 


10.23.2.4 


本 到 到 


上 行 地 址 


路 由 器 


10.23.2.37 


主机 B 


注解 ”从 技术 上 来 说 , 一 个 IP 地 址 由 4 个 字 节 (32 位 ) 组 成 , 现 以 abcd 指 代 ,a 和 d 的 范围 都 是 1~254， 


b 和 c 都 是 0~25$。 计 算 机 按 字 节 的 原始 形式 处 理 耳 地址。 但 人 们 为 了 方便 ， 将 其 记 为 
10.23.2.37 这 种 格式 ， 而 不 是 0x0A170225。 


IP 地 址 在 某 种 程度 上 就 像 邮 编 。 想 跟 其 他 主机 交流 ， 你 先 要 知道 其 PP 地 址 。 
让 我 们 先 来 看 看 自己 机 器 的 地 址 。 


9.3.1 查看 自己 计算 机 的 IP 地 址 
一 个 主机 可 以 有 多 个 也 地址， 以 下 命令 用 于 查看 主机 使 用 中 的 地 址 : 


$ ifconfig 


它 会 输出 很 多 结果 ， 其 中 应 该 包括 以 下 内 容 : 


etho Link encap:Ethernet HWaddr 10:78:d2:eb:76:97 
inet addr:10.23.2.4 Bcast:10.23.2.255 Mask:255.255.255.0 
inet6 addr: fe80::1278:d2ff:feeb:7697/64 Scope:Link 
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1 
RX packets:85076006 errors:0 dropped:0 overruns:0 frame:0 
TX packets:68347795 errors:0 dropped:0 overruns:0 carrier:0 
collisions:0 txqueuelen:1000 
RX bytes:86427623613 (86.4 GB) TX bytes:23437688605 (23.4 GB) 
Interrupt:20 Memory:fe500000-fe520000 


ifconfig 能 展现 网 际 层 和 物理 层 的 许多 细节 ( 有 时 不 止 一 个 网 络 地 址 )， 以 后 会 对 它们 进行 
详解 。 现 在 关注 一 下 第 二 行 ， 它 显示 该 主机 有 一 个 IPv4 的 地 址 10.23.2.4(inet addr)， 还 有 掩 码 
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(Mask ) 是 255.255.255.0。 这 是 子 网 掩 码 ， 定 义 了 IP 地 址 的 所 属 。 下 面 看 它 是 怎么 回 事 。 


注解 ifconfig 之 类 (还 有 route、arp 等 ) 的 命令 , 现 已 被 ip 取 代 。ip 功 能 更 强大 ,更 适合 写 脚 
本 时 使 用 ,可 大 部 分 人 还 是 喜欢 在 交互 式 操作 中 使 用 旧 的 命令 ,而 且 还 有 其 他 版 本 的 Unix 
兼容 这 些 旧 命令 ， 所 以 我 们 还 是 用 它们 来 讲解 。 


9.3.2 子 网 


子 网 就 是 一 组 相互 连接 的 、 带 有 按 序 排列 的 他 地 址 的 主机 。 通常 这 组 主机 会 在 同一 个 物理 网 络 
中 。 如 图 9-2 所 示 ，10.23.2.1 至 10.23.2.254 的 主机 可 以 构成 一 个 子 网 ， 其 至 10.23.1.1 至 10.23.255.254 
的 都 可 以 。 

划分 子 网 需要 考虑 两 点 : 一 个 是 网 络 前 级 ,一 个 是 子 网 掩 码 (上 一 节 中 的 ifconfig 的 Mask )。 
假若 你 要 建立 一 个 包含 10.23.2.1 到 10.23.2.254 的 子 网 ， 那 么 它们 通用 的 网 络 前 缀 就 是 10.23.2.0， 
子 网 掩 码 就 是 255.255.255.0。 下 面 解释 为 什么 是 这 样 。 

前 级 和 掩 码 是 怎样 表示 子 网 中 的 可 用 IP 的 ? 将 点 分 四 组 序列 转换 成 位 , 会 比较 易 懂 。 掩 人 码 标 
记 了 子 网 内 主机 能 共用 的 JP 位。 现 将 10.23.2.0 和 255.255.255.0 转 换 成 位 : 


10.23.2.0: 00001010 00010111 00000010 00000000 
255.255.255.0: 11111111 11111111 11111111 00000000 


再 将 前 缀 中 与 掩 码 的 那些 1 对 应 的 位 加 粗 : 


10.23.2.0: 00001010 00010111 00000010 00000000 


可 将 剩 下 未 加 粗 部 分 的 任何 位 设 为 1， 以 获得 可 用 的 IP 地 址 (除了 全 0 和 全 1 )。 
把 它们 合 在 一 起 ， 你 就 知道 一 个 IP 为 10.23.2.1、 子 网 掩 码 为 255.255.255.0 的 主机 是 如 何 跟 其 
他 以 10.23.2 打 头 的 主机 共处 一 个 子 网 的 了 。 这 整个 子 网 可 记 为 10.23.2.0/255.255.255.0。 


9.3.3 ”共用 子 网 掩 码 与 无 类 域内 路 由 选择 


幸运 的 话 ， 你 只 会 接触 到 像 255.255.255.0 或 255.255.0.0 这 种 简单 的 子 网 掩 码 。 不 幸 的 话 ， 你 
可 能 会 遇 到 难以 判断 子 网 可 用 IP 范 围 的 那 种 ， 例 如 255.255.255.192。 此 外 ， 你 还 可 能 会 看 到 男 一 
种 子 网 的 表示 方式 一 一 无 类 域内 路 由 选择 ( Classless Inter-Domain Routing， 以 下 简称 CIDR )， 它 
会 将 10.23.2.0/255.255.255.0 写 成 10.23.2.0/24。 

继续 以 上 一 节 提 到 的 二 进 制 掩 码 为 例 来 讲解 CIDR。 你 会 发 现 几乎 所 有 子 网 掩 码 都 是 一 堆 1， 
后 接 一 堆 0。 像 255.255.255.0 就 是 24 个 1 后 接 8 个 0, 掩 码 在 CIDR 中 只 记录 其 开头 的 1 的 个 数 , 因此 ， 
10.23.2.0/24 已 完整 地 表达 了 前 级 与 掩 人 码 。 

表 9-1 展 示 了 一 些 子 网 掩 码 及 其 CIDR 形 式 
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表 9-1 子 网 掩 码 


长 形式 CIDR 形 式 
255.0.0.0 8 
255.255.0.0 16 
255.240.0.0 12 
255.255.255.0 24 
255:255.235:192 26 


注解 ”如果 你 不 擅长 进 制 转换 ， 你 可 以 用 bc 或 dc 这 样 的 计算 命令 来 辅助 。 例 如 在 bc 中 输入 
obase=2;240， 能 输出 240 的 二 进 制 形 式 。 


识别 子 网 和 其 中 的 主机 只 是 第 一 课 ， 接 下 来 你 还 要 学 会 将 子 网 连接 起 来 。 


9.4 ”路 由 和 内 核 路 由 表 


将 各 子 网 连通 的 过 程 ， 就 是 识别 路 由 器 的 过 程 。 回 到 图 9-2，IP 地 址 为 10.23.2.4 的 主机 A 能 够 
直接 访问 本 地 网 络 10.23.2.0/24 上 的 其 他 主机 。 当 要 访问 互联 网 上 的 其 他 主机 时 , 它 需 要 通过 IP 为 
10.23.2.1 的 路 由 器 。 

Linux 内 核 是 如 何 区 分 两 个 不 同类 型 的 目标 地 址 的 呢 ? 其 实 ， 它 是 通过 一 种 叫 路 由 表 的 配置 
文件 来 决定 自身 的 路 由 行为 的 。route -n 命 令 可 以 显示 出 路 由 表 。 以 下 是 10.23.2.4 这 种 简单 的 主 
机 可 能 拥有 的 路 由 表 : 


$ route -n 

Kernel IP routing table 

Destination Gateway Genmask Flags Metric Ref Use Iface 
0.0.0.0 10.23.2.1 0.0.0.0 UG 0 0 0 etho 
10.23.2.0 0.0.0.0 255.255.255.0 UU 1 0 0 etho 


最 后 两 行 显示 路 由 信息 。pDestination 列 是 网 络 前 缀 ，Genmask 列 是 对 应 的 撼 码 。 这 里 有 两 个 
网 络 : 0.0.0.0/0( 所 有 IP 都 可 在 这 里 找到 对 应 ) 和 10.23.2.0/24。 每 个 网 络 的 Flags 列 都 有 个 U， 意 
味 着 该 路 由 是 活动 的 。 

这 些 Destination 的 差异 在 于 Gateway 与 Flags 的 组 合 。0.0.0.0/0 的 Flags 有 G， 表 示 需 要 通过 
Gateway( 10.23.2.1 ) 才 能 访问 它 。 而 10.23.2.0/24 的 Flags 无 G, 表示 它 能 被 直接 访问 。 该 行 的 Gateway 
列 记 为 0.0.0.0， 其 他 列 暂 时 不 管 。 

还 有 个 微妙 的 细节 : 如 果 想 发 信 给 10.23.2.132 ， 而 发 现 10.23.2.132 又 都 在 0.0.0.0/0 和 
10.23.2.0/24 之 中 ,那么 内 核 怎么 判断 应 该 用 第 二 个 呢 9 看 Destination 最 大 的 那个 就 行 。 这 里 CIDR 
就 帮 大 忙 了 : 10.23.2.0/24 符 合 ， 且 它 共 用 24 个 IP 位 ; 0.0.0.0/0 也 符合 ， 但 它 没有 共用 的 下位 ( 即 0 
个 ) 所以， 优先 使 用 10.23.2.0/24。 
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注解 ”-n 选 项 指定 显示 IP 地 址 而 非 主机 名 和 网 络 名 。 这 个 选项 值得 记 住 ， 因 为 其 他 网 络 命令 如 
netstat 也 有 该 项 。 


默认 网 关 


0.0.0.0/0 能 匹配 互联 网 中 的 所 有 IP， 它 是 默认 路 由 ， 其 Gateway 列 ( route -n 所 示 的 ) 的 地 址 
是 默认 网 关 。 如 果 目 标 地 址 没有 匹配 到 其 他 网 络 , 那 就 将 信息 从 默认 网 关 送 出 , 到 默认 路 由 里 找 。 
你 可 以 给 主机 取消 默认 网 关 的 配置 ， 那 它 将 只 能 访问 路 由 表 中 所 剩 的 网 域 。 


注解 ” 掩 码 255.255.255.0 的 网 络 多 数 会 给 路 由 分 配 1 这 个 地 址 (例如 0.23.2.0/24 中 的 10.23.2.1 )。 
但 这 只 是 约定 ， 当 然 也 有 例外 。 


9.5 基本 ICMP 和 DNS 工具 


现在 是 时 候 来 看 一 些 操 作 主 机 的 实用 工具 了 。 它们 涉及 两 种 协议 : 用 于 查找 路 由 和 连接 问题 
的 网 际 控制 报 文 协议 (Internet Control Message Protocol， 以 下 简称 ICMP )， 以 及 使 用 名 称 代替 IP 
地 址 以 便 人 们 记忆 的 域名 系统 (Domain Name Service， 以 下 简称 DNS )。 


9.5.1 ping 
ping ( 见 http://ftp.arl.mil/~mike/ping.html ) 是 最 常见 的 网 络 调试 工具 之 一 。 它 发 送 一 个 ICMP 


请 求 报 文 给 一 台 主 机 ， 这 会 使 该 接收 者 回 送 报 文 。 比 如 你 运行 ping 10.23.2.1， 然 后 得 到 这 样 的 
输出 信息 : 


$ ping 10.23.2.1 

PING 10.23.2.1 (10.23.2.1) 56(84) bytes of data. 

64 bytes from 10.23.2.1: icmp req=1 tt1=64 time=1.76 ms 
64 bytes from 10.23.2.1: icmp req=2 tt1=64 time=2.35 ms 
64 bytes from 10.23.2.1: icmp req=4 tt1=64 time=1.69 ms 
64 bytes from 10.23.2.1: icmp req=5 tt1=64 time=1.61 ms 


这 里 第 一 行 说 的 是 你 发 了 56 ( 包括 头 部 的 话 ， 是 84 ) 字 节 的 数据 包 给 10.23.2.1 ( 默认 一 秒 一 
包 ), 接 下 来 的 行 是 10.23.2.1 的 应 答 信 息 。 其 中 最 重要 的 是 序列 号 ( icmp_req ) 和 来 回 时 间 ( time )。 
返回 信息 的 容量 是 发 送信 息 的 容量 加 8 (数据 包 的 内 容 不 用 管 )。 

漏 掉 的 序列 号 ( 如 2 和 4 之 间 的 3 ) 通常 说 明 连 接 有 点 问题 。 另 外 ， 如 果 回 送 的 次 序 是 乱 的 ， 
那 也 是 有 问题 的 ， 因 为 现在 是 一 秒 一 包 ， 间隔 算 长 的 了 ， 而 如 果 有 些 包 超过 一 秒 才 回收 到 , 那 说 
明 连 接 很 慢 。 


图 灵 社 区 会 员 小 虎 (164142021@qq.com) 专 享 尊重 版 权 


160 第 9 章 网 络 与 配置 


来 回 时 间 是 指数 据 包 从 发 出 到 收回 所 经 历 的 时 间 。 如 果 包 无 法 到 到 目的 地 , 那么 最 后 一 站 的 
路 由 器 会 返回 host unreachable (无 法 到 达 主 机 ) 的 信息 。 

有 线 局 域 网 应 该 做 到 没有 丢 包 和 快速 响应 ( 上面 的 例子 来 自 无 线 局 域 网 )。 测 试 自己 的 子 网 
和 ISP 时 也 应 如 此 。 


注解 ”因为 一 些 安 全 性 问题 ,互联 网 上 有 些 主机 是 不 会 响应 ICMP 请 求 的 ， 所 以 你 可 能 打 得 开 一 
些 网 站 ,但 使 用 ping 却 无 法 收 到 响应 。 


9.5.2 traceroute 


学 到 本 章 后 面 的 路 由 知识 时 ， 你 可 能 会 需要 traceroute 这 个 基于 ICMP 的 工具 。 执 行 


traceroute host 能 显示 数据 包 到 达 目 标 主 机 所 走 过 的 路 。( traceroute -n 主机 名 不 查找 主机 名 。) 
它 的 优点 之 一 ， 就 是 能 告诉 你 每 个 路 由 之 间 的 回程 用 时 ， 如 以 下 片段 : 


206.220.243.106 1.163 ms 0.997 ms 1.182 ms 
4.24.203.65 1.312 ms 1.12 ms 1.463 ms 
64.159.1.225 1.421 ms 1.37 ms 1.347 ms 
64.159.1.38 55.642 ms 55.625 ms 55.663 ms 
209.247.10.230 55.89 ms 55.617 ms 55.964 ms 
209.244.14.226 55.851 ms 55.726 ms 55.832 ms 
209.246.29.174 56.419 ms 56.44 ms 56.423 ms 


Doco~Cwm 上 


[uy 


因为 6 和 7 之 间 的 有 个 很 大 的 延 时 ， 所 以 那 部 分 可 能 是 一 个 长 途 的 连接 。 

traceroute 的 输出 信息 可 能 会 不 连续 ， 在 某 步 出 现 超时 ， 而 后 面 的 步 又 能 正常 显示 。 那 很 可 
能 是 那 一 步 的 路 由 拒绝 返回 traceroute 想 要 的 调试 信息 ， 而 往 后 的 路 由 却 愿意 返回 结果 。 此 外 ， 
些 路 由 或 者 会 推迟 处 理 那 些 调试 请 求 ， 而 优先 处 理 那 些 不 带 调 试 的 。 


9.5.3 DNS 与 host 


IP 地 址 难 记 而 且 常 更 换 ， 所 以 我 们 用 www.example.com 这 种 名 字 来 指 代 它 。 你 系统 上 的 DNS 
库 通常 会 帮 你 搞定 这 种 转换 , 但 有 时 你 可 能 会 想 自 己 手 动 转换 。host 命 令 用 于 找 出 域名 的 人 P 地 址 : 


$ host www.example.com 
www.example.com has address 93.184.216.119 
www.example.com has IPv6 address 2606:2800:220:6d:26bf:1447:1097:aa7 


注意 , 这 个 例子 同时 显示 了 IPv4 地 址 93.184.216.119 和 一 个 更 长 的 IPv6 地 址 , 说 明 该 主机 已 拥 
有 一 个 下 一 代 互 联网 地 址 。 

你 也 可 以 用 host 来 反 查 地 址 的 域名 ， 即 输入 IP 地 址 而 不 是 域名 。 不 过 这 个 不 太 可 靠 。 因 为 
不 同 的 主机 名 可 以 指向 同一 个 IP 地 址 ， 所 以 DNS 无 法 得 知 哪个 主机 名 才 是 你 要 的 。 对 此 ,域名 管 
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岗 
滞 


E 员 必须 手动 建立 反 向 的 对 应 关系 ， 但 通常 没 人 这 么 做 。( DNS 的 问题 远 不 是 一 个 host 命 令 能 说 
清楚 的 ， 我 们 会 在 9.12 节 讲解 基本 的 客户 端 配置 。) 


9.6 ”物理 层 与 以 太 网 


网 际 层 的 互联 网 只 是 一 个 软件 上 的 概念 。 至今 我 们 都 还 没 讲 到 硬件 方面 的 东西 。 虽说 互联 网 
的 成 功 正 是 因为 它 无 关 硬件 ,能 在 任何 计算 机 、 任 何 操作 系统 、 任 何 网 络 上 通用 , 但 不 懂 硬 件 的 
层面 还 是 不 行 的 。 而 这 个 硬件 层面 ， 就 是 物理 层 。 

本 书 讨论 最 常见 的 一 种 物理 层 : 以 太 网 。 在 IEEE 802 标 准 的 家 族 中 ， 以 太 网 有 很 多 种 ， 从 有 

线 到 无 线 ， 但 它们 总 有 一 些 共性 ， 如 下 所 列 。 

口 所 有 以 太 网 上 的 设备 都 有 各 自 的 介质 访问 控制 (Media Access Control， 以 下 简称 MAC ) 
地 址 ， 有 时 这 也 叫 硬 件 地 址 。 它 与 主机 的 卫 地 址 无 关 ， 而 且 它 在 主机 所 处 的 以 太 网 中 是 唯 
一 的 (但 在 互联 网 这 种 大 型 的 软件 网 络 中 不 一 定 唯一 ) MAC 地 址 形 如 10:78:d2:eb:76:97。 

口 以 太 网 上 的 设备 以 帧 的 形式 发 送信 息 , 帧 里 除了 实际 的 数据 ,还 有 发 送 者 和 接收 者 的 MAC 
地 址 。 

以 太 网 是 一 个 单独 的 网 络 。 假设 你 有 一 台 主 机 连接 了 两 个 不 同类 型 的 以 太 网 ( 两 个 不 同 的 网 
络 接口 设备 )， 你 是 无 法 直接 使 帧 通过 该 主机 从 一 个 以 太 网 传送 到 另 一 个 以 太 网 的 ， 除 非 该 主机 
建立 了 一 种 特殊 的 桥梁 。 而 这 就 是 网 际 层 ( 如 互联 网 层 ) 的 工作 了 。 一 般 约 定 一 个 以 太 网 就 是 一 
个 互联 网 中 的 子 网 。 如 果 要 将 帧 送 到 另 一 个 子 网 , 工作 在 网 际 层 的 路 由 需 会 把 它 解 包 , 重新 封装 ， 
再 发 给 目标 ， 这 也 正 是 互联 网 的 做 法 。 


9.7 理解 内 核 网 络 接口 


网 际 层 与 物理 层 的 连接 方式 必须 使 得 网 际 层 拥有 不 依赖 于 硬件 环境 的 灵活 性 。Linux 内 核 自 
有 一 套用 于 沟通 这 两 层 的 方法 ， 叫 作 (内核 ) 网 络 接口 。 所 谓 配置 网 络 接口 ， 就 是 把 网 际 层 的 卫 
地 址 跟 物 理 层 的 硬件 标识 对 应 起 来 。 网 络 接口 的 名 字 通 常 概 括 了 它 的 硬件 类 型 ， 例 如 eth0 ( 计算 
机 的 第 一 块 以 太 网 卡 ) 和 wlan0 (无 线 接口 )。 

在 9.3.1 节 中 ， 你 已 学 到 了 查看 和 配置 网 络 接口 的 命令 ifconfig。 回 忆 一 下 它 的 输出 : 


豆 


etho Link encap:Ethernet HWaddr 10:78:d2:eb:76:97 
inet addr:10.23.2.4 Bcast:10.23.2.255 Mask:255.255.255.0 
inet6 addr: fe80::1278:d2ff:feeb:7697/64 Scope:Link 
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1 
RX packets:85076006 errors:0 dropped:0 overruns:0 frame:0 
TX packets:68347795 errors:0 dropped:0 overruns:0 carrier:0 
collisions:0 txqueuelen:1000 
RX bytes:86427623613 (86.4 GB) TX bytes:23437688605 (23.4 GB) 
Interrupt:20 Memory:fe500000-fe520000 


对 于 每 一 个 网 络 接口 , 左边 的 是 网 络 接口 的 名 字 , 右边 是 有 关 它 的 一 些 配 置 和 统计 信息 。 这 
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里 除了 有 我 们 之 前 讲 过 的 网 际 层 的 信息 , 还 显示 了 物理 层 的 MAC 地 址 ( Haddr )。 包含 UP 和 RUNNING 
的 行 表示 该 接口 处 于 工作 状态 。 

尽管 ifconfig 告 诉 了 你 关于 硬件 的 信息 ( 本 例 中 你 还 看 到 了 一 些 诸如 中 断 和 内 存 使 用 的 底层 
信息 )， 但 它 只 被 设计 作 查 看 和 配置 网 路 接口 的 初级 工具 。 要 想 深入 挖掘 网 络 接口 背后 的 硬件 层 
次 ， 展 示 或 更 改 以 太 网 卡 的 设 定 ， 我 们 可 以 用 ethtoo1。( 9.23 节 会 简单 介绍 无 线 网 络 。) 


9.8 配置 网 络 接口 


至 此 ， 网 络 栈 底部 的 所 有 基本 内 容 〈 物理 层 、 网 际 层 、Linux 内 核 网 络 接口 ) 已 经 涵盖 。 接 
着 你 还 要 做 以 下 工作 ， 把 那些 知识 点 串 起 来 ， 帮 助 Linux 机 需 连 到 互联 网 。 

(1) 接 上 网 络 硬件 ， 并 保证 内 核 有 它 的 驱动 。 如 果 有 ， 可 以 使 用 ifconfig -a 来 显示 该 硬件 对 
应 的 网 络 接口 。 

(2) 进行 任意 物理 层 设 置 ， 如 可 以 配置 网 络 名 称 和 密码 。 

(3) 给 网 络 接口 绑 定 一 个 耻 地 址 和 掩 码 ， 使 得 驱动 ( 物理 层 ) 能 识别 子 网 ( 网 际 层 )。 

(4) 添加 必要 的 路 由 ， 包 括 默认 网 关 。 

如 果 是 一 些 连 在 一 起 的 大 型 工作 站 ， 那 会 简单 一 些 : 第 一 步 由 内 核 来 做 ,第 二 步 不 用 做 ,第 
三 步 和 第 四 步 分 别 需 要 你 用 ifconfig 和 route 命 令 来 执行 。 

手动 设置 IP 地 址 和 掩 码 ， 需 要 执行 以 下 命令 : 


# ifconfig interface address netmask mask 


这 里 interface 是 网 络 接口 的 名 字 ， 例 如 etho。 当 网 络 接口 能 用 了 的 时 候 ， 就 可 以 添加 路 由 
了 【其实 就 是 设置 默认 网 关 ): 


# route add default gw gw-address 


参数 gw-address 是 你 默认 网 关 的 卫 地 址 ， 它 必须 处 于 你 其 中 一 个 网 络 接口 的 地 址 和 掩 码 所 定 
义 的 子 网 之 中 。 


手动 添加 和 删除 路 由 
以 下 命令 用 来 删除 默认 网 关 : 


# route del -net default 


你 可 以 在 默认 网 关 的 位 置 填 上 其 他 路 由 。 假 如 你 机 器 在 子 网 10.23.2.0024， 其 中 的 路 由 器 在 
10.23.2.44， 你 想 访 问 192.168.45.0/24, 那么 以 下 命令 让 我 们 可 以 通过 10.23.2.44 访 问 192.168.45.0: 


# route add -net 192.168.45.0/24 gw 10.23.2.44 
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删除 对 某 子 网 的 路 由 时 ， 则 无 需 填 写 “ 路 由 ”参数 : 


# route del -net 192.168.45.0/24 


在 深入 了 解 路 由 之 前 ， 你 就 应 该 知道 , 它 虽 然 表 面 上 看 起 来 很 简单 ,但 实际 上 很 复杂 。 对 于 
上 例 ， 你 还 必须 确保 192.168.45.0/24 上 的 主机 能 看 到 10.23.2.0/24 上 的 主机 ,否则 你 为 
192.168.45.0/24 添 加 路 由 器 也 是 没 用 的 。 

一 般 来 说 ， 你 应 该 尽量 让 事情 简单 一 点 ， 于 网 吉 坦 行 妥善 设置 ， 让 主机 只 有 一 个 默认 路 由 。 
如 果 你 有 多 个 子 网 并 想 通 过 路 由 联通 它们 ， 最 好 是 将 这 些 路 由 需 配 置 成 各 子 网 的 默认 网 关 。( 你 
会 在 9.17 节 看 到 相关 例子 。) 


9.9 开机 启动 的 网 络 配置 


我 们 已 经 讲 过 手动 配置 网 络 的 各 种 方法 , 而 验证 网 络 配 置 可 用 的 传统 方法 , 就 是 在 开机 时 让 
初始 化 程序 执行 一 个 含有 ifconfig 和 route 之 类 的 网 络 配 置 命 令 的 脚本 ,使 它 处 于 开机 的 一 连 串 
事件 当中 。 很 多 服务 器 仍 是 采取 这 种 做 法 。 

我 们 曾经 尝试 过 多 种 方法 以 使 开机 启动 网 络 配置 文件 规范 化 。 例 如 ifup 和 ifdown 命 令 ，( 理 

论 上 ) 开机 脚本 可 以 运行 ifup etho， 给 etho 接 口 执行 相应 的 ifconfig 和 ioute 命 令 。 不 幸 的 是 ， 
二 站 的 发 版 对 ifup 和 ifdown 的 实现 各 有 不 同 ,以 至 于 配置 文件 也 不 一 样 。 就 像 Ubuntu 的 ifupdown 
套装 是 用 /etc/network 的 配置 文件 ， 但 Fedora 则 用 /etc/sysconfig/network-scripts。 

你 无 需 知 道 这 些 配 置 文件 的 细节 。 但 如 果 你 真 的 想 手 写 配 置 而 不 用 你 发 行 版 自 带 的 配置 工 
具 ， 可 以 查 查 帮助 手册 ， 如 ifup(8) 和 interfaces(5)。 其 实 很 少 人 这 么 做 。 它 基本 上 只 见于 localhost 
的 网 络 接口 配置 ， 因 为 对 于 现代 的 系统 来 说 这 样 很 不 灵活 。 


9.10 ”手动 和 开机 启动 的 网 络 配置 带 来 的 问题 


以 前 大 多 数 系统 ( 现在 还 有 很 多 ) 都 在 开机 时 配置 网 络 , 但 现代 的 网 络 的 动态 特性 意味 着 一 
台 机 器 的 IP 地 址 不 是 一 成 不 变 的 。 与 其 将 IP 地 址 和 其 他 网 络 信息 存放 在 本 机 上 ， 不 如 在 接 入 网 络 
时 从 其 他 地 方 获取 。 大 部 分 网 络 客户 端 应 用 并 不 在 乎 你 用 什么 IP， 只 要 能 通 就 行 。 动 态 主 机 配置 
协议 ( Dynamic Host Configuration Protocol， 以 下 简称 DHCP，9.16 节 有 详细 介绍 ) 的 工具 可 以 给 
某 些 客户 端 做 一 些 简单 的 网 际 层 配置 。 
不 过 这 还 不 是 全 部 的 。 例 如 , 无 线 网 络 还 有 更 多 的 配置 , 诸如 网 络 名 称 、 权 限 、 加 密 技 术 等 。 
当 你 看 得 更 全 面 一 点 ， 你 会 发 现 你 的 系统 要 应 付 如 下 问题 。 
口 对 于 带 有 多 个 网 络 接口 的 机 器 〈 如 笔记 本 电脑 的 有 线 网 卡 和 无 线 网 卡 )， 怎 样 选择 用 哪个 
网 卡 ? 
口 如 何 接 人 网 络 ? 对 于 无 线 网 络 ， 这 包括 扫 获 网 络 名 称 、 选 择 网 络 名 称 、 获 取 权 限 。 
口 接 入 以 后 ， 怎 样 配置 那些 软件 网 络 层 ， 如 互联 网 层 ? 


谅 
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口 如 何 让 用 户 选 择 接 入 哪个 网 ”比如 说 如 何 让 用 户 接 入 一 个 无 线 网 ? 
口 被 断 开 时 ， 机 顺应 该 做 些 什么 ? 

普通 的 开机 脚本 做 不 到 上 面 所 说 的 ,另外 , 手动 做 也 很 麻烦 。 正 确 的 做 法 是 使 用 系统 服务 来 
监控 物理 网 络 , 根据 一 系列 规则 选择 出 用 户 需 要 的 内 核 网 络 接口 。 该 服务 还 需 交 互 ， 使 得 用 户 无 
需 使 用 极 具 破坏 力 的 root 账 号 也 能 在 不 同 环 境 选择 想 要 的 网 络 。 


9.11 一 些 网 络 配 置 管 理 器 


基于 Linux 的 系统 都 有 一 些 自动 配置 网 络 的 方法 。 桌 面 端 或 笔记 本 端 常用 NetworkManager。 
其 他 网 络 配 置 管理 程序 则 针对 更 小 型 的 租 入 式 系 统 ， 例 如 OpenWRT 的 netifd 、Android 的 
ConnectivityManager 服 务 、ConnMan 和 icd 等 。 下 面 我 们 简单 介绍 下 NetworkManager， 因 为 它 比 较 
受 欢 迎 。 我 们 不 会 讲 得 太 细 ， 因 为 如 果 你 有 宏观 的 认识 ,那么 你 应 该 很 容易 理解 NetworkManager 
和 其 他 配置 管理 需 。 


9.11.1 NetworkManager 的 操作 


NetworkManager 是 一 个 开机 时 系统 就 启动 的 守护 进程 。 跟 其 他 守护 进程 一 样 , 它 不 依赖 果 面 
组 件 。 它 的 任务 是 监听 系统 和 用 户 的 事件 ， 并 根据 一 堆 规则 来 改变 网 络 配 置 。 
NetworkManager 运 行 的 时 候 ， 维 护 着 两 个 层次 的 配置 。 第 一 层 是 它 从 内 核 收 集 而 来 ， 并 通 
过 监控 桌面 总 线 ( D-Bus ) 的 udev 来 维护 的 一 堆 可 用 的 硬件 设备 的 信息 。 第 二 层 是 更 具体 的 一 些 
连接 配置 : 硬件 设备 和 额外 的 物理 屋 、 网 际 层 的 配置 参数 。 例 如 ， 一 个 无 线 网 络 就 可 看 作 是 一 
个 连接 。 
NetworkManager 激 活 一 个 连接 的 做 法 , 是 将 任务 交 给 其 他 特定 的 网 络 工具 或 守护 进程 ( 例如 
dhclient， 它 会 从 接 上 的 本 地 网 络 那里 获得 网 际 层 配 置 )。 因 为 网 络 配置 工具 和 方案 因 不 同 发 行 
版 而 异 ， 所 以 NetworkManager 需 要 插件 来 适 配 它 们 ， 而 非 强 推 自己 的 标准 。 例 如 Debian/Ubuntu 
和 Red Hat 都 有 对 应 的 插件 。 

NetworkManager 启 动 时 ,会 收集 所 有 可 用 网 络 设备 的 信息 ,在 连接 列表 当中 决定 激活 某 一 个 。 
以 下 是 它 “ 作 出 决定 ”的 方法 。 

(1) 优先 连接 可 用 的 有 线 网 络 ， 若 没有 ， 则 连 无 线 网 络 。 

(2) 对 于 无 线 网 络 ， 优 先 选 择 以 前 连 过 的 。 

(3) 如 果 有 多 个 都 是 以 前 连 过 的 ， 则 选择 最 近 一 次 连接 的 那个 。 

连接 建立 以 后 ,就 由 NetworkManager 维 护 ， 直 至 其 断 开 , 或 被 更 好 的 网 络 取 代 ( 例如 用 着 无 
线 的 时 候 接 上 了 有 线 )， 或 用 户 强行 更 换 。 


9.11.2 与 NetworkManager 交 互 


多 数 人 是 通过 桌面 右上 (或 右 下 ) 角 的 一 个 指示 连接 状态 (有线 连 接 、 无 线 连接 或 无 连接 ) 
的 图 标 来 跟 NetworkManager 交 互 的 。 当 你 点 击 它 时 , 它 会 弹出 一 些 选 项 , 例如 让 你 选择 无 线 网 络 ， 
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以 及 断 开 当 前 网 络 。 这 一 图 标 在 不 同 的 保 面 环境 中 会 有 所 不 同 。 

除了 用 图 标 , 你 还 可 以 在 shell 中 使 用 其 他 工具 来 查询 和 操控 NetworkManager。 使 用 不 带 参 数 
的 nm-tool， 可 以 快速 地 列 出 你 当前 的 连接 状态 ， 里 面 有 网 络 接 口 及 它们 的 参数 。 这 有 些 类 似 
ifconfig， 但 没有 ifconfig 详 细 ， 尤 其 是 关于 无 线 网 络 方面 。 

nmcji 命 令 可 以 操控 NetworkManager， 它 也 很 常见 。 帮 助手 册 nmcli(1) 有 其 详细 介绍 。 

最 后 ，nm-online 命 令 会 告诉 你 网 络 能 不 能 用 。 如 果 能 用 ， 则 返回 退出 码 0， 其 他 情况 ,返回 
非 0。( 第 11 章 会 详细 介绍 在 shell 脚 本 中 使 用 退出 码 。) 


9.11.3 ”NetworkManager 的 配置 


一 般 NetworkManager 的 配置 文件 是 放 在 /etc/NetworkManager 目 录 中 , 里 面 有 各 种 不 同 的 配置 
文件 。 通 常 我 们 是 看 NetworkManager.conf 这 个 文件 。 它 的 格式 类 似 XGD 风 格 的 .desktop 文 件 和 微 
软 的 .ini 文 件 , 将 一 些 键 值 对 参数 写 在 不 同 的 小 节 中 。 几 乎 所 有 的 配置 文件 都 有 [main] 小 节 , 用 以 
定义 插件 。 以 下 就 是 在 Ubuntu 和 Debian 中 激活 ifupdown 插 件 的 例子 : 


[main] 
plugins=ifupdown, keyfile 


其 他 发 行 版 的 插件 还 有 ifcfg-rh( Red Hat 类 的 发 行 版 ) 和 ifcfg-suse( SuSE )。 上 例 中 的 keyfile 
插件 用 于 支持 NetworkManager 原 生 配 置 文 件 。 使 用 它 ， 你 就 能 在 /etc/NetworkManager/ 
system-connections 中 看 到 系统 能 认 出 的 连接 。 

大 多 数 情 况 下 ， 你 无 需 更 改 NetworkManager.conf， 因 为 更 具体 的 设置 是 在 其 他 文件 中 。 

1. 不 受 管理 的 接口 

虽然 NetworkManager 可 以 帮 你 管理 大 部 分 网 络 接口 ， 但 有 时 你 可 能 也 想 让 NetworkManager 
忽略 某 些 网 络 接口 。 例 如 ，localhost 的 配置 是 从 来 都 不 需要 改变 的 ， 而 且 人 们 也 和 希望 在 开机 时 就 
把 它 配 置 好 ， 因 为 可 能 有 其 他 服务 需要 用 到 它 。 所 以 大 多 数 的 发 行 版 都 会 让 localhost 免 受 
NetworkManager 管 理 。 

你 可 以 用 插件 来 让 NetworkManager 忽 略 某 个 网 络 接口 。 如 果 你 在 用 ifupdown ( 在 Ubuntu 和 
Debian 上 )， 那 么 ， 将 接口 的 配置 加 到 /etc/network/interfaces 文 件 中 ， 然 后 在 NetworkManager.conf 
文件 的 ifupdown 小 节 ， 把 managed 设 为 false: 


[ifupdown] 
managed=false 


对 于 Fedora 或 Red Hat 的 ifcfg-rh 插 件 , 则 是 在 /etc/sysconfig/network-scripts 的 名 为 ifcfg-* 的 配置 
文件 中 找 出 这 样 的 行 : 


NM_CONTROLLED=yes 
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如 果 没 找到 这 样 的 行 , 或 找到 值 为 no 的 行 , 则 代表 NetworkManager 会 忽略 该 接口 。 通 常 这 fg-lo 
文件 就 设 好 了 是 “忽略 ”的 。 你 还 可 以 指定 忽略 某 个 硬件 地 址 : 


HWADDR=10:78:d2:eb:76:97 


如 果 这 两 类 网 络 配 置 方 案 你 都 不 使 用 ， 你 还 是 可 以 通过 keyfile 持 件 ， 直 接 在 Network 
Manager.conf 文 件 里 指定 要 忽略 的 硬件 地 址 ， 如 下 : 


[keyfile] 
unmanaged-devices=mac:10:78:d2:eb:76:97;mac:1c:65:9d:cc:ff:b9 


2. 调度 

NetworkManager 配 置 的 最 后 一 个 细节 问题 是 , 让 其 他 系统 事件 与 网 络 接口 的 开局 或 关闭 产生 
关联 。 举 个 例子 ， 有 些 关 于 网 络 的 守护 进程 需要 知道 何 时 才 开 始 或 停止 监听 某 个 网 络 接口 (如 下 
一 章 讲 到 的 安全 shell 守 护 进程 )。 

当 网 络 接 口 的 状态 改变 时 , NetworkManager 会 运行 /etc/NetworkManager/dispatcher.d 里 的 所 有 
东西 ， 并 给 予 一 个 up 或 者 down 的 参数 。 这 种 是 比较 简单 的 ， 但 很 多 系统 都 有 自己 的 一 套 网 络 控制 
脚本 ， 而 不 会 将 调度 程序 脚本 放 在 那个 目录 里 。 就 像 Ubuntu， 它 有 一 个 叫 o1ifupdown 的 脚本 ， 用 
来 运行 /etc/network 下 某 个 子 目 录 里 的 东西 ， 如 /etc/network/if-up.d。 

这 些 脚本 的 细节 ， 跟 其 余 NetworkManager 的 配置 一 样 , 都 是 不 重要 的 , 重要 的 是 记录 下 你 修 
改过 哪些 配置 ， 以 便 恢复 。 还 有 ， 要 勤 于 查看 系统 中 的 脚本 文件 。 


9.12 解析 主机 名 


配置 网 络 还 有 一 个 基础 任务 ， 就 是 用 DNS 解 析 主 机 名 。 前 文 我 们 已 讲 过 ， 用 主机 名 解析 工 
具 host 可 以 将 主机 名 (如 www.example.com ) 转换 成 IP 地 址 ( 如 10.23.2.132 )。 

DNS 与 之 前 的 网 络 话题 的 不 同 之 处 在 于 它 在 应 用 层 ， 完 全 是 用 户 空 间 的 事 。 技 术 上 来 说 ， 它 
与 本 章 所 说 到 的 物理 层 和 网 际 层 没什么 关系 。 但 若 没 有 正确 的 DNS 配置 , 你 的 连接 也 不 会 起 作用 。 
IP 地 址 可 能 会 改变 ， 而 且 没 人 想 记 住 一 长 串 数字 。 自 动 的 网 络 配 置 服务 ， 如 DHCP， 几 乎 总 是 包 
售 DNS 的 配置 。 

差不多 所 有 Linux 网 络 应 用 都 会 做 DNS 查找 ， 步 又 基本 如 下 所 示 。 

(1) 应 用 会 调用 一 个 函数 ， 去 查找 主机 名 对 应 的 P。 该 函数 在 系统 共享 库 中 ， 应 用 只 管 调用 ， 
而 无 需 了 解 其 中 实现 手段 。 

(2) 当 该 函数 运行 时 , 它 会 根据 一 系列 规则 (规则 在 /etc/nsswitch.conf 中 ) 来 决定 查找 的 计划 。 
例如 ， 通 常会 有 这 样 的 规则 一 一 先 检 查 /etc/hosts 里 的 重 写 ， 再 使 用 DNS。 

(3) 使 用 DNS， 先 要 找到 DNS 服 务 器 (在 一 个 额外 的 文件 里 定义 了 这 个 DNS 服 务 器 的 I 人 P )。 

(4) 该 函数 发 送 一 个 DNS 查 询 的 请 求 给 DNS 服 务 器 。 

(5) DNS 服 务 器 将 请 求 中 主机 名 对 应 的 IP 返 回 给 函数 ， 再 由 函数 返回 给 应 用 。 
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简单 来 说 就 是 这 样 。 典型 的 现代 系统 中 还 加 入 了 其 他 东西 来 提高 查找 效率 和 增加 扩展 性 ， 
现在 我 们 先 不 涉及 这 些 ， 只 看 看 基本 的 内 容 。 


t 
一 、 
I 工 


9.12.1 /etc/hosts 
大 多 数 系统 都 允许 你 通过 /etc/hosts 重 写 主机 名 的 查找 ， 该 文件 看 起 来 会 是 这 样 : 


127.0.0.1 localhost 
10.23.2.3 atlantic.aem7.net atlantic 
10.23.2.4 pacific.aem7.net pacific 


一 般 都 会 在 这 里 看 到 localhost 的 条 目 (9.13 节 会 介绍 )。 


注解 ”在 以 往 的 艰苦 岁月 里 ， 人 人 都 要 复制 一 份 集 中 的 host 文 件 到 自己 机 器 上 ， 以 便 跟 上 IP 的 变 
更 ( 详 见 RFCs 606 、608、623 和 625 )。 但 随 着 ARPANET 和 互联 网 的 发 展 ， 已 经 不 需要 
这 样 做 了 。 


9.12.2 resolv.conf 文 件 


传统 的 做 法 是 在 /etc/resolv.conf 文 件 中 指定 DNS 服 务 器 。 简 单 的 话 ， 会 像 以 下 这 样 ， 这 里 ISP 
的 DNS 服 务 器 为 10.32.45.23 和 10.3.2.3: 


search mydomain.example.com example.com 
nameserver 10.32.45.23 
nameserver 10.3.2.3 


search 的 那 行 定义 了 针对 残缺 主机 名 ( 仅 有 主机 名 的 第 一 部 分 ， 如 myserver 而 非 myserver. 
example.com ) 的 查找 方式 。 这 里 指定 了 会 到 host.mydomain.example.com 和 host.example.com 查 找 。 
但 平常 是 没 这 么 简单 的 。DNS 配 置 现 在 有 了 很 多 改善 。 


9.12.3 ”缓存 和 零 配置 DNS 


传统 的 DNS 配置 有 两 个 主要 的 问题 。 第 一 个 问题 是 ,本 机 不 缓存 DNS 服务 器 的 回应 ， 这 样 每 
次 都 请 求解 析 会 使 网 络 减 慢 。 为 了 解决 这 个 问题 , 很 多 机 器 (包括 作为 DNS 服务 器 的 路 由 器 ) 都 
会 运行 一 个 守护 进程 ， 尽 可 能 地 拦截 DNS 请 求 ,， 并 返回 缓存 中 的 DNS 回应 ， 做 不 到 的 话 才 把 请 求 
发 送 到 DNS 服务 器 。 最 常见 的 这 种 守护 进程 是 dnsmasq 和 nscd。 你 还 可 以 建立 BIND (标准 的 Unix 
DNS 守护 进程 ) 来 做 缓存 。 如 果 你 在 /etc/resolv.conf 看 到 127.0.0.1 ( localhost )， 或 者 运行 nslookup 
-debug host 时 看 到 127.0.0.1 的 话 ， 那 你 就 正 运行 着 DNS 缓存 守护 进程 。 

dnsmasq 默 认 的 配置 文件 是 /etc/dnsmasq.conf， 但 你 的 发 行 版 可 能 会 重 写 它 。 在 Ubuntu 上 ， 如 
果 你 用 NetworkManager 手 动 建立 了 一 个 连接 , 你 会 在 /etc/NetworkManager/system-connections 的 某 
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个 文件 上 找到 它 ， 因 为 当 NetworkManager 激 活 一 个 连接 的 时 候 ， 也 同时 按照 那个 配置 来 启动 
dnsmasq。( 你 可 以 通过 去 除 NetworkManagerconf 中 对 dnsmasq 的 注释 来 重 写 这 个 规则 )。 

第 二 个 问题 是 扩展 性 差 , 查找 域名 还 要 应 付 一 堆 配 置 文件 。 假如 你 在 你 的 网 络 中 加 了 一 套 设 
备 ， 你 很 可 能 想 马上 用 域名 来 访问 它 。 现 在 ， 零 配置 域名 服务 系统 正 是 为 解决 这 种 问题 而 诞生 ， 
例如 多 播 DNS (以 下 称 mDNS ) 和 简单 服务 发 现 协议 ( Simple Service Discovery Protocol， 以 下 简 
称 SSDP )。 若 你 想 在 本 地 网 络 中 按 域名 查找 一 个 主机 ,那么 可 以 发 起 广播 ， 如 果 该 主机 存在 ， 则 
它 会 告诉 你 它 的 卫 。 这 些 协议 会 在 DNS 解析 之 前 工作 ， 以 告知 有 哪些 服务 可 用 。 

Linux 用 得 最 多 的 mDNS 实 现 是 Avahi。 你 会 经 带 看 到 /etc/nsswitch.conf 把 mdns 作 为 解析 器 ， 而 
这 个 /etc/nsswitch.conf 就 是 接 下 来 要 讲 的 。 


9.12.4 /etc/nsswitch.conf 文 件 


/etc/nsswitch.conf 文 件 掌管 着 一 些 域 名 相关 的 优先 级 设 定 ， 例 如 账号 和 密码 。 但 本 章 只 谈 及 
它 的 DNS 设 定 。 你 系统 中 的 该 文件 应 该 有 这 样 的 一 行 : 


hosts : files dns 


files 在 dns 之 前 ， 表 明 先 查找 /etchosts ， 后 查找 DNS 服务 器 。 通 常 这 种 做 法 是 可 行 的 (尤其 
是 查找 localhost， 下 文 会 提 到 ), 但 你 的 /etc/hosts 应 尽 可 能 简短 ， 以 免 带 来 性 能 问题 。 小 型 专用 网 
里 的 主机 名 当然 可 以 放 进 去 。( /etc/hosts 还 可 在 开机 初期 、 网 络 不 可 用 时 帮助 解析 localhost。 ) 


注解 DNS 是 个 很 大 的 话题 ， 如 果 你 的 工作 需要 处 理 域 名 ， 可 参考 Cricket Liu 和 Paul Albitz 所 著 
DNS and BIND, Sth edition ( O’Reilly, 2006 )。 


9.13 Localhost 


ifconfig 的 输出 里 还 有 个 1o: 


lo Link encap:Local Loopback 
inet addr:127.0.0.1 Mask:255.0.0.0 
inet6 addr: ::1/128 Scope:Host 
UP LOOPBACK RUNNING MTU:16436 Metric:1 


lo 接口 是 一 个 虚拟 的 网 络 接口 , 它 叫 作 环 回 (1loopback ), 因为 它 指向 的 是 自己 。 连 接 127.0.0.1， 
其 实 就 是 连接 本 机 。 当 发 送 数 据 到 内 核 网 络 接口 0， 内核 只 会 将 其 重新 包装 ， 并 通过 lo 回复。 

开机 脚本 所 用 到 的 静态 网 络 配 置 一 般 就 是 lo 环 回 接口 。 例 如 ，Ubuntu 的 ifup 会 读 取 
/etc/network/interfaces 中 的 lo ， 而 Fedora 会 用 /etc/sysconfig/network-interfaces/ifcfg-lo。 你 还 可 以 用 
grep 在 /etc 下 的 配置 文件 中 挖掘 到 很 多 关于 环 回 设备 的 配置 。 
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9.14 传输 层 : TCP、UDP 和 Service 


到 目前 为 止 , 我 们 只 看 到 了 数据 包 如 何在 互联 网 的 主机 之 间 传 递 , 即 本 章 开 头 的 “发 送 方 怎 
么 知道 要 发 往 哪 里 ”。 那 么 现在 就 该 谈 谈 “ 接 收 方 怎么 知道 接收 了 什么 ”了 。 计 算 机 如 何 将 所 接 
收 的 数据 包 呈 现 给 进程 , 这 是 个 很 重要 的 问题 。 内 核 擅长 处 理 数据 包 , 但 用 户 空间 程序 则 不 擅长 。 
另外 , 灵活 性 也 是 要 考虑 的 : 不 同 的 应 用 要 能 同时 地 使 用 网 络 ( 例如 你 可 以 同时 运行 邮件 应 用 和 
其 他 一 些 网 络 客户 端 )。 

传输 层 协 议 能 让 网 络 层 的 包 与 应 用 层 的 需求 无 缝 连接。 其 中 最 常用 的 两 个 协议 就 是 TCP ( 传 
输 控 制 协 议 ) 和 UDP (用户 数 据 报 协议 )。 我 们 主要 讲 一 下 TCP， 因 为 它 是 用 得 最 多 的 ,但 同时 
也 会 简要 地 讲 一 下 UDP。 


9.14.1 TCP 端 口 与 连接 


TCP 方 式 是 指 不 同 的 网 络 应 用 使 用 不 同 的 网 络 端 只。 端口 只 是 一 个 数字 。 如 果 把 了 正比 作 大 厦 
的 地 址 ， 那 么 端口 就 是 大 厦 里 不 同 的 邮箱 号 码 ， 是 一 种 更 细 的 划分 。 

使 用 TCP 时 ， 应 用 会 在 本 机 的 一 个 端口 和 远程 机 器 的 一 个 端口 之 间 建 立 连接 (不 要 跟 
NetworkManager 的 连接 混淆 )。 例 如, 网 页 浏览 器 会 在 本 机 的 36406 端 口 和 远 端 的 80 端 口 间 建立 连 
接 。 从 该 应 用 的 角度 来 看 ，36406 是 本 地 端口 ，80 是 远程 端口 。 

一 个 连接 可 以 用 “IP 加 端口 ”代码 来 标识 。 要 想 查 看 你 机 器 上 的 连接 ， 可 用 netstat。 这 里 
展示 了 一 些 TCP 连 接 : 选项 -n 表 示 不 用 对 主机 名 进行 DNS 解 析 ， 而 -t 则 是 只 输出 TCP 连 接 。 


$ netstat -nt 
Active Internet connections (w/o servers) 


Proto Recv-0 Send-0 Local Address Foreign Address State 

tcp 0 0 10.23.2.4:47626 10.194.79.125:5222 ESTABLISHED 
tcp 0 0 10.23.2.4:41475 172.19.52.144:6667 ESTABLISHED 
tcp 0 0 10.23.2.4:57132 192.168.231.135:22 ESTABLISHED 


Local Address 和 Foreign Address 列 位 的 内 容 是 针对 你 的 机 需 而 言 的 。 也 就 是 说 ， 你 的 机 器 有 
个 网 络 接口 使 用 了 IP 地 址 10.23.2.4, 其 中 端口 7626、41475 和 57132 都 已 连接 了 。 第 一 行 的 意思 是 ， 
47626 与 10.194.79.125 的 5222 端 口 连 接 了 。 


9.14.2 ”建立 TCP 连 接 


要 建立 传输 层 的 连接 , 进程 会 发 送 一 系列 特别 的 数据 包 , 先 初始 化 一 个 从 其 本 机 端口 到 远 端 
端口 的 连接 。 为 了 识别 这 个 连接 请 求 并 进行 答复 , 远 端 必须 要 有 个 进程 监听 着 那个 被 请 求 的 端口 。 
通常 请 求 方 被 称 为 客户 端 ， 监 听 方 被 称 为 服务 器 (第 10 章 有 更 详细 的 介绍 )。 

你 应 该 了 解 ， 客 户 端 挑 选 的 本 地 端口 是 当前 未 用 到 的 ， 而 远 端 端口 则 是 “公认 的 ”。 回 忆 上 
一 节 讲 的 netstat 的 输出 : 
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Proto Recv-0 Send-0 Local Address Foreign Address State 
tcp 0 0 10.23.2.4:47626 10.194.79.125:5222 ESTABLISHED 


按 刚才 所 说 的 规则 ,这 是 一 个 由 本 机 发 起 的 连接 ， 因 为 本 机 端口 看 上 去 像 是 随便 挑选 的 ， 而 
远 端 端 口 则 是 Jabber 或 XMPP 消 息 服务 的 公认 端口 5222。 


注解 ”动态 挑选 的 端口 叫 作 暂 时 端口 。 


而 如 果 本 机 端口 是 公认 的 端口 ， 那 这 个 连接 就 可 能 是 从 远 端 发 起 的 。 下 面 例子 中 ， 
172.24.54.234 的 远 端 连接 着 本 机 的 80 端 口 (默认 Web 端 口 )。 


Proto Recv-0 Send-0 Local Address Foreign Address State 
tcp 0 0 10.23.2.4:80 172.24.54.234:43035 ESTABLISHED 


远 端 与 你 的 公认 端口 连 着 ， 意 味 着 你 机 器 上 有 服务 器 正 在 监听 着 该 端口 。 想 对 此 进行 确认 ， 
可 用 netstat 列 出 你 的 机 絮 正 在 监 昕 的 所 有 TCP 端 口 。 


$ netstat -ntl 
Active Internet connections (only servers) 


Proto Recv-0 Send-Q Local Address Foreign Address State 
tcp 0 0 0.0.0.0:80 0.0.0.0:* LISTEN 
tcp 0 0 127.0.0.1:53 0.0.0.0:* LISTEN 
-- Snip-- 


local address 有 0.0.0.0:80 的 那 行 ， 说 明 本 机 正 监听 着 来 自 所 有 远 端 对 自己 80 端 口 的 连接 。( 服 
务 需 可 以 限制 某 些 接口 的 访问 , 正如 最 后 一 行 ， 某 个 服务 只 监听 着 localhost 对 5$3 的 连接 。) 想 知道 
更 多 ， 可 用 lsof 来 识别 是 哪个 进程 正在 进行 监听 (会 在 10.5.1 节 介绍 lsof )。 


9.14.3 ”端口 的 数字 和 /etc/services 


如 何 得 知 哪些 端口 是 公认 端口 ? 这 个 问题 没有 标准 答案 , 但 有 个 不 错 的 判定 方法 , 是 去 看 看 
/etc/services。 这 是 一 个 纯 文本 文件 ， 保 存 着 一 些 常用 端口 及 其 服务 的 名 字 ， 如 下 所 示 。 


ssh 22/tcp # SSH Remote Login Protocol 
smtp 25/tcp 
domain 53/udp 


第 一 列 是 服务 名 称 ， 第 二 列 是 端口 及 其 特定 的 传输 协议 〈 可 以 不 是 TCP )。 


注解 ”除了 /etc/services, 还 有 一 个 由 RFC6335 网 络 标准 文档 管理 的 端口 在 线 注 册 网 站 http:/www. 


ana.org/。 
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Linux 中 只 有 超级 用 户 运 行 的 进程 才能 使 用 1 到 1023 的 端口 。 其 余 用 户 可 以 监听 或 建立 1024 及 
以 上 端口 的 连接 。 


9.14.4 TCP 的 特点 


作为 一 种 传输 层 协议 ,， TCP 之 所 以 流行 是 因为 它 对 应 用 没什么 要 求 。 应 用 的 进程 只 需要 知道 
如 何 打开 (或 监听 入 读 取 、 写 入 和 关闭 连接 即 可 。 对 应 用 来 说 ， 这 一 过 程 就 像 收发 数据 流 一 样 ， 
而 进程 的 工作 就 跟 处 理 文件 一 样 简单 。 

然而 ,还 是 有 很 多 “幕后 ”工作 的 。 其 一 ，TCP 实 现 需 要 知道 怎样 将 发 出 的 数据 流 分 装 成 数据 
包 。 比 这 麻烦 的 , 是 要 知道 怎样 将 收 到 的 一 系列 包 转 换 成 进程 所 需 的 数据 流 , 尤其 是 当 这 些 包 无 序 
到 来 时 ,更 为 麻烦 。 其 二 , 使 用 TCP 的 主机 还 要 做 错误 检查 : 数据 包 在 经 由 互联 网 传输 的 过 程 中 可 
能 会 丢失 或 受 损 ，TCP 必 须 进行 纠正 。 图 9-3 简 要 描绘 了 主机 使 用 TCP 的 方式 发 送信 息 的 过 程 。 

幸好 ， 你 不 需要 很 了 解 其 中 的 细节 ， 只 要 知道 Linux 的 TCP 实 现 基 本 是 在 内 核 当 中 ， 而 且 涉 
及 内 核 数据 结构 。 你 的 认识 水 平 只 要 达到 类 似 9.21 节 所 讲 的 内 容 即 可 。 


9.14.5 UDP 


UDP 比 TCP 简 单 得 多 。 单条 信息 就 可 以 构成 一 次 传输 , 没有 数据 流 的 说 法 。 跟 TCP 不 同 的 是 ， 
UDP 不 纠正 数据 包 的 丢失 或 乱 序 。 事 实 上 ， 尽 管 UDP 也 有 端口 的 概念 ， 但 不 会 用 此 来 建立 连接 ! 
一 台 主 机 从 其 某 个 端口 发 信息 到 一 台 服 务 器 的 某 个 端口 ,然后 该 服务 器 想 回 就 回 ,不 想 回 就 不 回 。 
UDP 确实 有 查 错 的 功能 ， 但 并 不 要 求 接收 方 纠 错 。 

若 把 TCP 看 成 是 打 电 话 , 那么 UDP 就 像 是 寄 信 、 发 电报 或 发 即时 消息 ( 当然 即时 消息 稍微 可 
靠 些 )。 用 UDP 的 应 用 ， 看重 的 是 速度 一 一 尽快 发 出 消息 。 它 们 不 愿 承 担 TCP 的 开销 ， 因 为 它们 
已 假设 两 台 机 之 间 的 网 络 是 可 靠 的 。 它 们 不 需要 TCP 的 纠 错 功能 , 因为 它们 有 自己 一 套 纠 错 系统 ， 
或 他 们 根本 不 在 乎 出 错 。 

使 用 UDP 的 一 个 例子 就 是 网 络 时 间 协 议 (Network Time Protocol， 以 下 简称 NTP )。 客 户 端 发 
送 一 个 简短 的 请 求 给 服务 器 ， 以 获取 当前 时 间 , 而 服务 器 的 回复 也 同样 简短 。 因 为 客户 端 希望 尽 
可 能 快 地 得 到 回复 ,所 以 使 用 UDP 是 很 合适 的 。 如 果 服 务 器 的 回复 传 丢 了 , 那么 客户 端 可 以 再 请 
求 ， 或 放弃 。 另 一 个 例子 是 视频 通话 。 它 用 UDP 的 方式 发 送 图 像 ， 如 果 有 些 丢 失 了 ， 接 收 方 会 尽 
力 修 补 。 


注解 ”本章 剩余 部 分 是 一 些 进 阶 的 网 络 话题 ， 例 如 网 络 过 滤 、 路 由 器 等 。 它 们 属于 较 低 的 网 络 
层级 : 物理 层 、 网 际 层 和 传输 层 。 如 果 你 对 这 些 内 容 不 感 兴趣 ， 可 直接 跳 到 下 一 章 : 用 
户 空间 的 应 用 层 。 你 会 从 用 户 进程 的 角度 看 待 网 络 的 使 用 ， 而 不 仅仅 是 停留 在 地 址 和 数 
据 包 的 传输 层面 。 
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蜂 按 TCP 方 式 发 送 的 消息 


Hil How are you today? 


源 主机 将 消息 拆 成 多 个 包 


互联 网 把 包 发 送 给 目标 


包 到 达 目 标 主 机 (不 一 定 以 传输 时 的 顺序 到 达 ) 


的 主机 将 这 些 包 重新 拼接 成 消息 


| 


Hil How are you today? 


图 9-3 ”用 TCP 的 方式 发 信息 


ep 


9.15 ”普通 本 地 网 络 


下 面 来 看 看 9.3 节 所 讲 到 的 普通 网 络 的 另外 一 些 组 件 。 回 忆 下 ， 这 个 网 络 由 作为 子 网 的 LAN 
和 连接 子 网 与 互联 网 的 路 由 需 构 成 。 而 现在 你 要 学 的 是 以 下 内 容 : 
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口 子 网 中 的 主机 如 何 自动 获取 网 络 配置 ; 

口 如 何 建立 路 由 ; 

口 路 由 需 究 竟 是 什么 ; 

口 如 何 知道 子 网 该 用 什么 卫 ; 

口 如 何 建 立 防 火 墙 ， 以 过 滤 来 自 互联 网 的 无 用 信息 。 
我 们 先 从 “ 子 网 中 的 主机 如 何 自动 获取 网 络 配置 ”开始 。 


9.16 理解 DHCP 


所 谓 “ 自 动 获取 网 络 配置 *， 就 是 让 主机 使 用 动态 主机 配置 协议 (Dynamic Host Configuration 
Protocol， 以 下 简称 DHCP ) 来 获取 卫 、 子 网 掩 码 、 默 认 网 关 和 DNS 服务 器 。 除 了 无 需 手动 设置 网 
络 配 置 的 好 处 以 外 ，DHCP 还 可 以 帮助 网 络 管理 员 防 止 IP 冲 突 ， 以 及 减轻 网 络 变更 带 来 的 影响 。 
现在 很 少 有 不 使 用 DHCP 的 网 络 。 

主机 必须 先 能 发 信 至 其 网 络 中 的 PHCP 服 务 器 ， 才 能 通过 DHCP 获 取 网 络 配置 。 因 此 每 个 物 
理 网 络 必须 有 自己 的 DHCP 服 务 器 ， 而 在 普通 的 网 络 〈9.3 节 讲 的 那 种 ) 中 ， 我 们 通常 以 路 由 器 充 
当 DHCP 服 务 需 。 


注解 ”第 一 次 发 送 DHCP 请 求 时 ， 主 机 是 不 知道 DHCP 服 务 器 的 地 址 的 ， 所 以 它 通 常会 把 请 求 广 
播 给 网 络 中 的 所 有 主机 。 


主机 只 向 DHCP 服 务 器 要 求 在 一 定时 间 内 “租用 ” 某 个 IP。 当 租用 期 结束 ，DHCP 客 户 端 可 
以 要 求 更 新 租约 。 
9.16.1 Linux 的 DHCP 客 户 端 


尽管 网 络 管理 系统 有 很 多 种 ， 但 它们 几乎 全 都 使 用 互联 网 软件 联盟 ( Internet Software 
Consortium， 以 下 简称 ISC ) 的 dhclient 程 序 来 工作 。 你 可 以 在 命令 行 手 动 测试 dhclient， 但 在 此 
之 前 ， 你 必须 移 除 所 有 默认 网 关 。 这 个 测试 需要 指定 网 络 接口 的 名 字 ( 这 里 以 eth0 为 例 ): 


# dhclient etho 


开始 后 ，dhclient 会 将 它 的 进程 ID 放 在 /var/run/dhclient.pid 中 ， 而 将 租用 信息 放 在 /var/state/ 
dhclient.leases 中 。 


9.16.2 ”Linux 的 DHCP 服 务 器 


你 可 以 在 Linux 机 器 上 运行 DHCP 服 务 器 ， 以 妥善 地 管理 耻 地 址 。 然 而 ， 除 非 你 管理 着 一 个 拥 
有 多 个 子 网 的 大 型 网 络 ， 和 否则 你 最 好 还 是 选择 内 置 DHCP 服 务 器 的 路 由 需 。 
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关于 DHCP 服 务 咒 ， 最 重要 的 一 点 可 能 是 : 一 个 子 网 最 好 只 有 一 个 DHCP 服 务 需 ， 以 防止 卫 
冲突 和 配置 错误 。 


9.17 将 Linux 配置 成 路 由 器 
你 可 以 把 路 由 器 看 成 是 一 种 不 止 一 个 网 络 接口 的 计算 机 。 将 Linux 机 器 配置 成 路 由 器 不 是 什 
么 难事 。 


假设 你 有 两 个 LAN 子 网 10.23.2.0/24 和 192.168.45.0/24， 你 可 以 用 一 个 有 三 个 网 络 接口 (两 个 
用 于 LAN、 一 个 用 于 连接 互联 网 的 上 行 线 ) 的 Linux 路 由 器 连通 它们 。 如 图 9-4， 这 跟 之 前 讲 过 的 


简单 网 络 的 例子 没 太 大 区 别 。 


10.23.2.1| 上 行 地 址 | 192.168.45. 1 


子 网 192.168.45.0/24 (局 域 网 ) 


子 网 10.23.2.0/24 (局 域 网 ) 


10.23.2.4 


10.23.2.13 2 


主机 C 


10.23.2.37 


主机 B 


192.168.45.2 


主机 C 


主机 C 


图 9-4 ”以 路 由 器 连接 的 两 个 子 网 


192.168.45.163 


主机 C 


该 路 由 器 在 两 个 LAN 子 网 的 IP 分 别 为 10.23.2.1 和 192.168.45.1。 配 置 好 IP 后 ， 它 的 路 由 表 大 概 
会 如 下 所 示 ( 现实 中 的 接口 名 字 可 能 会 不 一 样 ; 可 以 暂时 忽略 用 于 互联 网 的 IP ): 


Destination Gateway Genmask Flags Metric Ref Use Iface 
10.23.2.0 0.0.0.0 255.255.255.0 U 0 0 0 etho 
192.168.45.0 0.0.0.0 255.255.255.0 U 0 0 0 eth1 


现在 两 个 子 网 上 的 主机 都 可 将 该 路 由 器 作为 默认 网 关 了 (10.23.2.0/24 的 是 10.23.2.1 ， 而 
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192.168.45.0/24 的 是 192.168.45.1 )。 如 果 10.23.2.4 想 发 数据 包 给 10.23.2.0/24 以 外 的 任何 机 器 , 它 会 
将 数据 包 传 给 10.23.2.1。 例 如 ， 想 从 10.23.2.4 ( 主机 A ) 发 数据 包 到 192.168.45.61 ( 主机 E )， 数 据 
包 会 经 过 路 由 器 ( 10.23.2.1 ) 的 eth0 进 入 路 由 器 ， 再 从 eth1 出 去 。 

然而 ， 默 认 情 况 下 ，Linux 内 核 不 会 自动 地 在 子 网 之 间 进 行 包 传递 。 为 了 使 基本 路 由 功能 
效 ， 你 需要 用 以 下 命令 激活 路 由 器 内 核 的 卫 转 发 ; 


# Sysct1 -w net.ipv4.ip_forward 


一 旦 你 输入 这 个 命令 , 而 两 个 子 网 的 主机 又 懂得 将 数据 包 发 往 该 机 器 的 话 , 那么 该 机 器 就 能 
在 两 个 子 网 间 实 现 路 由 功能 。 要 使 它 即使 重启 也 能 如 旧 , 你 可 以 在 /etc/sysctl.conf 文 件 里 加 入 这 个 
命令 。 有 些 发 行 版 允许 你 把 它 写 到 /etc/sysctl.d 的 某 个 文件 里 ， 以 使 升级 时 不 覆盖 掉 该 命令 。 


互联 网 的 上 行 线 


当 该 路 由 器 有 第 三 个 接口 作为 互联 网 的 上 行 线 , 并 也 已 设置 好 时 ,两 个 子 网 中 的 使 用 该 路 由 
作为 默认 网 关 的 所 有 主机 就 都 能 连 上 互联 网 了 。 但 这 也 使 得 事情 变 复 杂 了 。 因 为 像 10.23.2.4 这 样 
的 耳 地 址 是 处 于 所 谓 的 “私有 网 络 ” 中 ， 对 于 互联 网 来 说 是 不 可 见 的 。 为 了 连 上 互联 网 ， 你 必须 
在 路 由 器 上 建立 网 络 地 址 转换 (Network Address Translation ， 以 下 简称 NAT ) 的 功能 。 几 乎 所 有 
的 路 由 器 软件 都 支持 这 功能 ， 所 以 这 里 也 不 例外 。 下 面 我 们 再 详细 看 一 下 私有 网 络 。 


9.18 ”私有 了 网络 


假设 你 想 建立 你 自己 的 网 络 , 且 你 已 准备 好 了 机 器 、 路 由 器 和 网 络 硬 件 , 那么 按 你 目前 对 一 
个 普通 网 络 的 认识 水 平 ， 你 接 下 来 应 该 会 问 :“ 我 应 该 用 什么 IP 子 网 ?” 
如 果 你 想 让 你 的 卫 在 互联 网 上 可 见 ， 你 应 该 从 ISP 那 里 买 一 个 。 然 而 ， 因 为 IPv4 的 地 址 数 非 
常 有 限 ， 所 以 要 买 的 话 ， 花 费 会 比较 高 ， 而 让 互联 网 上 的 其 他 人 看 到 你 服务 器 的 下 也 没什么 用 。 
大 多 数 人 是 不 需要 这 样 做 的 ， 因 为 他 们 只 作为 客户 端 访 问 互 联网 。 

以 往 ， 比 较 经 济 的 替代 方案 是 采用 互联 网 标准 文档 RFC 1918/6761 ( 如 表 9-2 ) 定义 的 那些 私 
有 子 网 。 


表 9-2 RFC 1918 和 6761 定 义 的 私有 网 络 


网 络 子 网 掩 码 CIDR 形 式 
10.0.0.0 255.0.0.0 10.0.0.0/8 
192.168.0.0 255.255.0.0 192.168.0.0/16 
172.16.0.0 255.240.0.0 172.16.0.0/12 


你 可 以 随意 对 私有 子 网 进行 分 割 。 除 非 你 想 让 254 以 上 的 主机 组 成 单个 网 络 ， 不 然 采 用 本 章 
举例 的 10.23.2.0/24 那 样 的 小 子 网 就 可 以 。( 掩 码 为 24 的 网 络 ， 也 叫 C 类 网 络 。 尽 管 这 种 叫 法 有 点 
过 时 ， 但 依然 是 有 意义 的 。) 
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这 是 什么 意思 呢 ? 私有 网 络 对 互联 网 来 说 是 不 可 见 的 , 而 互联 网 也 不 会 直接 发 数据 包 到 私有 
网 络 里 。 如 果 没 有 其 他 辅助 的 话 ， 私 有 网 络 中 的 主机 是 无 法 跟 外 界 沟通 的 。 在 互联 网 上 拥有 真实 
IP 地 址 的 路 由 器 ， 需 要 一 些 方 法 来 沟通 私有 网 络 和 互联 网 。 


9.19 网 络 地 址 转换 (IP 伪装 ) 


NAT 是 把 单个 IP 分 享 给 整个 私有 网 络 的 常见 方法 , 而 且 一 般 它 在 家 庭 和 小 型 办 公 网 络 环境 中 
都 可 用 。Linux 中 ， 人 们 用 得 最 多 的 NAT 是 IP 伪 装 。 

NAT 背 后 的 基本 思想 是 , 路 由 器 做 的 不 只 是 将 数据 包 从 一 个 子 网 传 到 男 一 个 子 网 , 而 且 还 将 
数据 包 转 化 了 。 互 联网 上 的 主机 只 看 到 该 路 由 器 ， 而 看 不 到 其 背后 的 私有 网 络 。 私 有 网 络 里 的 主 
机 无 需 什 么 特别 的 配置 ， 默 认 网 关 就 使 用 该 路 由 器 。 

这 个 系统 大 概 是 按 下 面 的 方式 运作 的 。 

(1) 私有 网 络 里 的 一 个 主机 想 与 外 界 通信 ， 所 以 它 会 通过 路 由 需 发 出 连接 请 求 的 数据 包 。 

(2) 路 由 器 拦截 了 该 请 求 ， 而 不 是 传 出 去 。( 因为 传 出 去 的 话 是 没 用 的 ， 外 界 不 能 用 它 私 有 网 
络 的 人 P 找 到 它 。) 

(3) 路 由 器 根据 该 数据 包 中 关于 目标 的 信息 ， 开 启 其 自身 与 该 日 标的 连接 。 

(4) 连接 成 功 后 ， 路 由 器 就 伪造 一 个 “连接 已 建立 ”的 信息 返回 给 内 网 主机 。 

(5) 现在 路 由 器 成 了 内 网 主机 和 远程 主机 之 间 的 中 介 。 远程 主机 并 不 知道 该 内 网 主机 的 存在 ， 
它 只 和 路 由 器 接头 。 

但 实际 上 没 这 么 简单 。 一 般 IP 路 由 知道 的 就 只 有 源 和 目标 的 IP 地 址 。 然 而 ， 如 果 路 由 器 只 有 
网 际 层 , 那么 分 处 内 网 和 外 网 的 两 台 主机 就 不 能 在 同一 时 间 建 立 多 个 连接 ,因为 网 际 层 不 能 区 分 
同一 个 源 对 同一 个 目标 的 不 同 的 应 用 请 求 。 因 此 ，NAT 必 须 在 网 际 层 之 前 就 对 数据 包 进 行 解剖 ， 
以 得 到 更 多 标识 信息 (尤其 是 获取 传输 层 的 UDP 和 TCP 端 口号 )。UDP 比 较 简单 ， 因 为 它 只 获取 
端口 号 ， 而 不 建立 连接 。 但 TCP 就 复杂 了 。 

想 将 Linux 机 器 当成 NAT 路 由 器 , 就 要 激活 以 下 所 有 内 核 配置 : 网 络 包 过 滤 (“防火 墙 支持 ”)、 
连接 记录 、IP 表 支持 、 全 NAT 以 及 MASQUERADE 目 标 支 持 。 大 多 数 发 行 版 都 自 带 这 些 功 能 。 

接着 你 还 要 运行 一 些 看 起 来 挺 复杂 的 iptables 命 令 ， 以 使 路 由 器 为 私有 子 网 提供 NAT 功 能 。 
下 面 就 是 eth1 接 内 网 、etho 接 外 网 的 NAT 例 子 ( iptables 的 详细 语法 将 在 9.21 节 介绍 ): 


# sysctl] -w net.ipv4.ip_forward 

# iptables -P FORWARD DROP 

# iptables -t nat -A POSTROUTING -o etho -j MASOUERADE 

# iptables -A FORWARD -i etho -o eth1 -m state --state ESTABLISHED,RELATED -j ACCEPT 
# iptables -A FORWARD -i eth1 -o etho -j ACCEPT 


注解 尽管 NAT 在 实际 中 应 用 广泛 ， 但 记 住 ， 它 只 是 应 付 I[Pv4 地 址 贫乏 的 一 个 技巧 。 在 美好 的 
将 来 ， 我们 所 有 人 都 会 用 上 IPv6 ( 下 一 代 互 联网 ) 的 更 大 、 更 复杂 的 地 址 空间 ， 而 不 用 
再 作 任何 转换 。 
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除非 是 软件 开发 者 , 否则 一 般 不 会 用 到 以 上 命令 , 尤其 是 现在 已 经 有 了 那么 多 功能 各 异 的 路 
由 器 产品 。 但 Linux 在 网 络 中 的 角色 不 止 这 些 。 


9.20 ”路 由 器 与 Linux 


以 往 带 宽 小 的 时 候 ， 人 们 是 使 用 各 自 的 宽带 连接 互联 网 的 。 但 后 来 ， 随 着 带宽 增 大 ， 就 发 展 
成 使 用 一 台 运 行 NAT 的 路 由 器 来 共用 一 条 宽带 连接 出 去 。 
制造 商 们 为 了 响应 新 的 市 场 需求 ， 推 出 了 制定 的 路 由 硬件 ， 其 中 包含 高 效 的 处 理 器 、 闪 存 、 
多 个 网 络 口 一 一 足以 给 普通 的 网 络 提 供 DHCP、NAT 等 重要 服务 。 在 软件 方面 ， 则 选用 Linux。 他 
们 添加 必要 的 内 核 功能 ， 抽 掉 一 些 用 户 软 件 ， 再 创建 一 个 图 形 化 的 管理 界面 。 

这 类 路 由 器 一 面世 ,就 吸引 了 很 多 人 去 搞 硬 件 。 有 个 制造 商 ，Linksys, 被 要 求 开放 其 某 个 软 
件 的 源 代码 ， 开 放 之 后 ， 便 出 现 了 一 个 Linux 发 行 版 ， 叫 作 OpenWRT。( WRT 是 Linksys 的 某 个 产 
品 型 号 。) 

除了 出 于 兴趣 , 还 是 有 其 他 原因 促使 人 们 采用 这 些 发 行 版 的 : 它们 通常 比 制造 商 的 固件 要 稳 
定 , 尤其 是 对 于 老 旧 的 路 由 器 ， 而 且 它 们 一 般 有 功能 加 强 。 例 如 ， 想 桥接 一 个 无 线 网 络 的 话 ， 很 
多 制造 商都 会 要 你 买 匹配 的 硬件 ， 但 有 了 OpenWRT， 你 就 不 再 需要 担心 品牌 的 差异 或 者 硬件 的 
新 上 日 。 因 为 该 操作 系统 是 开放 的 ， 只 要 里 面 添加 了 对 某 硬 件 的 支持 ， 就 可 运行 该 硬件 。 

你 可 以 使 用 本 书 的 知识 来 测试 那些 制定 的 Linux 固 件 ， 虽 然 它 们 各 不 相同 ， 尤 其 是 登录 时 的 
不 同 。 因 为 他 们 很 多 都 是 圣 入 式 的, 所 以 开源 固件 倾向 于 使 用 BusyBox 来 提供 shell 功 能 。BusyBox 
是 一 个 单独 的 可 执行 程序 ， 能 让 我 们 使 用 1s 、grep 、cat 、more 等 Unix 命 令 。 它 功能 有 限 ， 但 节 
省 空间 。 还 有 ， 艇 人 式 系统 的 开机 初始 化 程序 都 是 很 简约 的 。 然 而 ， 这 些 限制 通常 都 不 是 问题 ， 
因为 制定 的 Linux 固 件 大 多 包含 一 个 网 页 化 的 管理 界面 ， 跟 原矿 的 差不多 。 


9.21 防火 墙 


路 由 器 尤其 应 该 包含 某 种 防火 墙 , 来 为 你 的 网 络 抵御 一 些 不 速 之 客 的 请 求 。 防 火 墙 是 一 种 软 
件 和 (或 ) 硬件 的 配置 ， 处 于 互联 网 和 小 型 网 络 之 间 的 路 由 器 之 中 ， 以 保证 小 型 网 络 免 于 来 自 互 
联网 的 攻击 。 你 也 可 以 给 每 一 台 机 器 都 配备 防火 墙 , 这 样 每 台 机 器 都 可 以 从 数据 包 的 级 别 筛选 进 
出 的 数据 ( 从 应 用 层级 别 的 话 ， 往 往 是 使 用 服务 器 的 程序 进行 访问 控制 )。 为 每 台 机 器 配备 防火 
墙 ， 这 叫 作 他 过 滤 。 

系统 可 以 在 这 些 情况 下 过 滤 数 据 包 : 

口 接收 数据 包 时 ; 
口 发 送 数据 包 时 ; 
口 或 将 数据 包 转 发 到 其 他 主机 或 网 关 时 。 

没有 防火 墙 的 话 , 系统 只 会 按 原来 的 做 法 来 处 理 数 据 包 。 防 火 墙 会 在 上 述 的 几 种 场合 设立 检 
查 点 。 这 些 检查 点 会 根据 以 下 标准 来 丢弃 、 拒 绝 或 者 接受 数据 包 : 
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口 源 或 目标 的 卫 或 子 网 ; 

口 源 或 目标 的 端口 〈 传输 层 的 信息 ); 

口 防火 墙 的 网 络 接口 。 

防火 墙 能 让 你 接触 到 Linux 内 核 中 处 理 IP 包 的 子 系统 。 现 在 我 们 就 来 看 一 下 。 


9.21.1 Linux 防 火 墙 基础 


Linux 中 ， 防 火 墙 的 规则 是 链 型 的 。 一 个 表 就 是 一 套 链 。 数 据 包 在 Linux 网 络 子 系统 的 各 部 分 
移动 时 ， 内 核 就 会 对 包 应 用 某 套 规则 。 例 如 ,从 物理 层 接收 到 一 个 新 的 包 之 后 ， 内 核 就 会 根据 输 
入 的 数据 激活 对 应 的 规则 。 

这 些 数据 结构 由 内 核 来 维护 。 整 个 系统 叫 作 iptables， 可 以 使 用 用 户 空间 的 iptables 命 令 来 创 
建 和 修改 规则 。 


注解 ”现在 有 了 一 个 叫 nfttables 的 新 系统 ， 用 于 取代 iptables。 但 本 文 讲述 防火 墙 还 是 以 iptables 
为 主 。 


因为 规则 表 有 很 多 ， 表 里 面 的 规则 也 很 多 ,所 以 使 得 数据 包 的 流动 变 得 比较 复杂 。 然 而 ,你 


一 般 都 只 会 接触 到 一 个 叫 作 filter ( 过 滤 ) 的 表 , 它 控 制 基 本 的 包 流动 。 该 表 里 面 有 三 个 基本 的 链 : 
对 应 包 输 入 的 INPUT、 对 应 包 输 出 的 OUTPUT 和 对 应 包 转 发 的 FORWARD。 

图 9-5 和 图 9-6 简 要 展示 了 对 数据 包 应 用 这 些 规 则 的 流程 。 之 所 以 有 两 个 图 ， 是 因为 要 区 分 输 
和 人 (图 9-5 ) 和 输出 (图 9-6 )。 如 你 所 见 ， 由 网 络 输入 的 数据 包 可 能 会 走 INPUT 而 不 走 FORWARD 
及 OUTPUT， 而 输出 的 包 则 不 会 走 INPUT 或 FORWARD。 


来 自 网 络 的 包 


INPUT 链 处 理 


FORWARD bo 
0 发 向 目的 地 


图 9-5 ”接收 包 时 经 历 的 链 
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本 地 进程 产生 的 包 OUTPUT 链 处 理 发 向 目的 地 


图 9-6 发 出 包 时 经 历 的 链 


， 


而 实际 上 ， 整 个 过 程 并 不 只 涉及 这 三 个 链 。 例 如 ，PREROUTING 和 POSTROUTING 链 也 会 
作用 于 数据 包 ， 而 链 进 程 也 可 能 会 在 三 个 底层 网 络 层次 的 任意 一 层 发 生 。 想 看 到 全 部 的 规则 ,可 
在 网 上 搜 “Linux netfilter packet flow”( Linux 网 络 过 滤器 数据 包 流 )。 但 这 样 搜 出 来 的 图 ， 都 尝试 
将 数据 包 所 有 可 能 的 路 线 纳 入 其 中 。 而 将 路 线 图 按 数 据 包 的 来 源 进 行 分 解 会 比较 好 理解 , 如 图 9-5 
和 9-6 所 示 。 


9.21.2 ”设置 防火 墙 规 则 
现在 来 看 看 全 表 系 统 实际 上 是 如 何 工作 的 。 先 用 以 下 命令 查看 当前 的 设置 : 


# iptables -L 


通常 输出 的 链 设 置 是 空 的 : 


Chain INPUT (policy ACCEPT) 


target prot opt source destination 
Chain FORWARD (policy ACCEPT) 9 
target prot opt source destination 


Chain OUTPUT (policy ACCEPT) 
target prot opt source destination 


如 果 没 有 指定 对 数据 包 使 用 何 种 规则 ， 防 火 墙 就 会 执行 其 默认 的 “策略 ”( policy )。 上 例 中 
的 三 个 链 的 默认 策略 都 是 ACCEPT， 即 让 内 核 允 许 数据 包 通 过 。DROP 策 略 是 放弃 数据 包 。 命 令 
iptables -P 可 以 设置 链 的 策略 : 


# iptables -P FORNARD DROP 


如 果 你 对 192.168.34.63 这 个 用 户 不 胜 其 烦 ， 想 将 其 屏蔽 ， 你 可 执行 这 句 : 


# iptables -A INPUT -s 192.168.34.63 -j DROP 


在 上 例 中 ， 参 数 -A INPUT 给 INPUT 链 增加 了 一 个 规则 。 而 -s 192.168.34.63 指 定 规则 所 针对 的 
源 IP，-j DROP 指 的 是 ， 当 数据 包 符 合 规 则 时 ， 内 核 会 将 其 丢弃 。 因 此 ， 你 的 机 器 就 会 丢弃 所 有 
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来 自 192.168.34.63 的 数据 包 。 
想 查 看 设置 好 的 规则 ， 用 iptables -Ll 命令 : 


Chain INPUT (policy ACCEPT) 
target prot opt source destination 
DROP all -- 192.168.34.63 anywhere 


麻烦 的 是 , 192.168.34.63 那 家 伙 还 发 动 了 他 子 网 上 的 所 有 人 向 你 请 求 SMTP ( TCP 端口 为 25 ) 
连接 。 想 摆脱 他 们 ， 执 行 以 下 命令 : 


# iptables -A INPUT -s 192.168.34.0/24 -p tcp --destination-port 25 -j DROP 


这 个 例子 为 源 址 增加 了 掩 码 限定 符 ， 并用-p tcp 限 定 了 只 屏蔽 TCP 包 。 再 详细 一 点 ， 用 
--destination-port 25 声 明 只 屏蔽 端口 25。 现 在 下 表 中 的 INPUT 应 该 是 像 下 面 这 样 : 


Chain INPUT (policy ACCEPT) 


target prot opt source destination 
DROP all -- 192.168.34.63 anywhere 
DROP tcp -- 192.168.34.0/24 anywhere tcp dpt:smtp 


现在 问题 解决 了 ， 但 后 来 你 会 发 现 ， 你 地 址 为 192.168.34.37 的 朋友 不 能 给 你 发 邮件 了 ， 
为 你 连 他 也 屏蔽 了 。 为 了 快速 修复 ， 你 可 能 会 执行 以 下 命令 : 


# iptables -A INPUT -s 192.168.34.37 -j ACCEPT 


但 不 管用 。 要 想 查 明 原 因 ， 看 看 下 面 的 新 链 : 


Chain INPUT (policy ACCEPT) 


target prot opt source destination 

DROP all -- 192.168.34.63 anywhere 

DROP tcp -- 192.168.34.0/24 anywhere tcp dpt:smtp 
ACCEPT all -- 192.168.34.37 anywhere 


内 核 是 按 从 顶 到 底 的 顺序 来 读 取 链 配 置 的 ， 并 执行 第 一 条 匹配 的 配置 。 

第 一 条 并 不 匹配 192.168.34.37 ， 但 第 二 条 却 可 以 ， 因 为 它 适 用 于 从 192.168.34.1 到 
192.168.34.254 的 所 有 主机 ， 而 第 二 条 的 策略 是 丢弃 包 。 当 某 策 略 可 用 时 ， 内 核 就 按 其 执行 ， 且 
不 再 往 下 看 了 。( 你 会 发 现 192.168.34.37 可 以 给 你 除了 25 外 的 所 有 端口 发 数据 包 ， 因 为 第 二 条 规 
则 只 适用 于 端口 25。 ) 

解决 方法 是 将 该 规则 移 到 顶部 。 首 先 ， 执 行 以 下 命令 来 市 掉 第 三 条 : 


# iptables -D INPUT 3 


然后 ， 使 用 iptables -I 在 链 的 顶部 插入 第 三 条 规则 : 
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# iptables -I INPUT -s 192.168.34.37 -j ACCEPT 


想 在 顶部 以 外 的 地 方 插 入 ， 可 在 链 名 后 指定 行 号 (如 iptables -I INPUT 4 ... )。 


9.21.3 ”防火 墙 策略 


虽然 以 上 教程 告诉 了 你 怎样 插入 规则 ,以 及 内 核 是 如 何 处 理 IP 链 的 , 但 我 们 还 没 真正 了 解 防 
火 墙 是 如 何 进 行 工作 的 。 下 面 就 来 介绍 一 下 。 

防火 墙 的 基本 应 用 场景 有 两 种 : 一 种 是 保护 单 台 机 器 ( 在 每 台 机 器 的 INPUT 链 插入 规则 ), 另 
一 种 是 保护 整个 网 络 里 的 机 器 (在 路 由 器 的 FORWARD 链 插入 规则 )。 在 这 两 种 情况 中 ， 如 果 你 只 设 
置 默认 ACCEPT， 并 针对 不 断 出 现 的 垃圾 信息 数据 包 而 持续 添加 DROP ， 那 么 就 不 能 实现 真正 意义 上 
的 安全 。 你 只 能 允许 可 信任 的 数据 包 流 入 ， 而 对 其 他 的 数据 包 则 进行 阻 断 。 

例如 ， 如 果 你 有 一 个 SSH 服 务 器 在 TCP 端 口 22， 那 就 不 应 该 让 别人 连 到 你 22 以 外 的 端口 。 要 
做 到 这 样 ， 首 先 可 将 INPUT 链 策略 设置 为 DROP: 


# iptables -P INPUT DROP 


但 可 通过 以 下 命令 ， 人 允许 ICMP 通 信 ( 给 ping 或 其 他 工具 使 用 ): 


# iptables -A INPUT -p icmp -j ACCEPT 


确保 你 能 收 到 自己 发 给 自己 的 包 , 包括 你 自己 的 中 地 址 和 localhost127.0.0.1。 假设 你 IP 地 址 为 
my_addr: 


# iptables -A INPUT -s 127.0.0.1 -j ACCEPT 
# iptables -A INPUT -s my addr -j ACCEPT 


如 果 你 控制 着 你 的 整个 子 网 ( 并 信任 其 中 所 有 东西 ), 你 可 以 将 my_addr 替 换 为 你 的 子 网 地 址 
掩 码 ， 例 如 10.23.2.0/24。 

现在 ,虽然 你 想 阻 止 所 有 TCP 连 接 请 求 ， 但 你 还 得 确保 你 能 对 外 界 发 出 TCP 连 接 请 求 。 而 因 
为 所 有 由 外 而 内 的 TCP 请 求 都 是 只 有 SYN 位 是 被 置 位 的 , 所 以 用 以 下 这 条 命令 可 做 到 只 屏蔽 接收 
的 请 求 : 


# iptables -A INPUT -p tcp '!' --syn -j ACCEPT 


接着 , 如果 你 用 的 是 基于 UDP 的 DNS, 你 必须 允许 接收 域名 服务 器 发 给 你 的 包 ， 这样 你 的 机 
器 才能 借助 DNS 查 找 域名 。 例如 ， 人 允许 接收 /etc/resolv.conf 中 所 有 DNS 服 务 器 的 数据 包 的话 ， 用 以 
下 这 条 命令 (ns_addr 是 域名 服务 器 地 址 ): 


条 


荆 


# iptables -A INPUT -p udp --source-port 53 -s ns_addr -j ACCEPT 


最 后 ， 人 允许 所 有 SSH 连 接 : 
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# iptables -A INPUT -p tcp --destination-port 22 -j ACCEPT 


以 上 iptables 设 置 适用 于 很 多 情况 ， 涵 盖 了 所 有 方向 的 连接 (尤其 是 宽带 )， 因 为 人 侵 者 多 喜 
欢 逐 个 端口 来 攻击 。 你 还 可 以 按 路 由 器 的 场景 来 改变 一 下 防火 墙 的 策略 : 把 INPUT 改 成 FORNARD ， 
并 在 source 和 destination 处 填 和 信子 网 。 要 进行 更 高 级 的 设置 ， 可 以 使 用 Shorewall 之 类 的 工具 。 

以 上 讨论 仅 与 安全 策略 有 关 。 其 中 关键 的 思想 是 ， 选 出 可 信 的 ， 而 不 是 选 出 可 疑 的 。 还 有 ， 
卫 防 火 墙 只 是 网 络 安全 的 一 部 分 而 已 。( 下 一 章 有 更 多 介绍 。) 


9.22 以 太 网 、IP 和 ARP 


关于 以 太 网 上 的 JP 协议 , 我 们 还 有 一 点 很 有 趣 的 没 讲 到 。 之 前 讲 过 ， 主 机 将 IP 数 据 包 封 装 成 
以 太 网 帧 , 以 使 其 能 在 物理 层 上 传输 到 另 一 台 主 机 。 我 们 还 讲 过 , 帧 里 面 是 不 带 有 IP 地 址 信息 的 ， 
只 有 MAC 地 址 。 那 么 问题 是 : 在 为 IP 数 据 包 进行 帧 的 封装 时 ， 主 机 怎么 知道 哪个 MAC 对 应 哪个 
目标 IP 地 址 呢 ? 

一 般 我 们 不 考虑 这 个 问题 ， 因 为 网 络 软件 包含 了 一 套 查 找 MAC 地 址 的 自动 化 系统 ， 叫 地 址 
解析 协议 ( Address Resolution Protocol， 以 下 简称 ARP )。 使 用 以 太 网 作为 物理 层 、 卫 作为 网 络 层 
的 主机 ， 维 护 着 一 个 叫 ARP 缓 存 的 表 ， 其 中 包含 了 了 下地 址 与 MAC 地 址 的 映射 关系 。 在 Linux 中 ， 
ARP 缓 存在 内 核 中 。 想 要 查看 你 的 机 器 的 ARP 缓 存 ， 可 使 用 命令 arp。( 与 其 他 网 络 命令 类 似 ， 选 
项 -n 指 定 不 进行 DNS 反 向 查询 。) 


$ arp -n 

Address Hwtype Hwaddr Flags Mask Iface 
10.1.2.141 ether 00:11:32:0d:ca:82 C etho 
10.1.2.1 ether 00:24:a5:b5:a0:11 C etho 
10.1.2.50 ether 00:0c:41:f6:1c:99 C etho 


一 台 机 器 刚 开 机 时 ， 是 没有 ARP 缓 存 的 。 那 么 MAC 是 怎样 被 缓存 进来 的 呢 ? 一 切 始 于 该 机 
器 想 给 另 一 台 主 机 发 送 数据 包 时 。 如 果 目 标 卫 不 在 ARP 缓 存 中 ， 则 下 列 步 又 会 执行 。 

(1) 源 主 机 创建 一 个 包含 ARP 请 求 包 的 以 太 网 帧 ， 以 求 获知 目标 卫 所 对 应 的 MAC。 

(2) 源 主 机 向 目标 子 网 的 整个 物理 网 络 广播 该 帧 。 

(3) 如 果子 网 中 有 个 主机 知道 确切 的 MAC 地 址 ， 它 就 会 创建 一 个 包含 该 地 址 的 回复 包 和 帧 发 
给 源 主 机 。 通 常 ， 发 出 回复 的 就 是 目标 主机 ， 它 只 是 把 自己 的 MAC 地 址 回复 给 源 主 机 。 

(4) 源 主机 将 IP-MAC 地 址 对 加 入 到 ARP 缓 存 中 ， 并 继续 进行 其 他 步 又 。 


注解 ” 记 住 , ARP 只 应 用 于 本 地 子 网 ( 可 参考 9.4 节 )。 至 于 你 子 网 以 外 的 地 方 ， 你 的 主机 只 会 将 
数据 包 发 给 路 由 器 ， 之 后 的 事 就 不 由 你 管 了 。 当 然 ， 你 的 主机 还 是 要 知道 路 由 器 的 MAC 
的 ， 而 这 也 是 用 ARP 来 获取 。 
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ARP 唯 一 的 实际 问题 是 ， 如 果 你 把 某 个 了 下 的 网 络 接口 换 了 (例如 在 测试 时 )， 那 么 其 缓存 就 
相当 于 过 期 了 ， 因 为 另 一 个 网 络 接口 的 MAC 是 不 同 的 。Unix 系 统 会 定时 丢弃 那些 不 活跃 的 ARP 
缓存 条 目 ， 所以， 除了 那些 过 期 的 缓存 数据 会 暂时 带 来 一 些小 干扰 外 ,并 没有 太 大 的 问题 。 如 果 
想 立 即 删除 的 话 ， 可 以 用 这 个 命令 : 


# arp -d host 


你 还 可 以 查看 某 个 网 络 接口 上 的 ARP 组 存 : 


$ arp -i interface 


arp(8) 帮 助手 册 介 绍 了 如 何 手动 设置 ARP 绥 存 ， 但 你 一 般 用 不 着 这 么 做 。 


注解 ” 别 把 ARP 跟 反 向 地 址 解析 协议 (了 Reverse Address Resolution Protocol， 以 下 简称 RARP ) 混 
消 。RARP 按 MAC 地 址 来 查找 卫 地 址 。 在 DHCP 流 行 之 前 ， 一 些 无 盘 工 作 站 和 其 他 设备 会 
用 RARP 来 获取 网 络 配置 ， 而 现在 已 经 很 少 这 样 做 了 。 


9.23 ”无 线 以 太 网 


原理 上 ,无线 以 太 网 ( 即 WiFi ) 与 有 线 网 络 没 有 太 大 区 别 。 跟 任何 有 线 设 备 一 样 ， 它们 都 有 
MAC 地 址 ， 也 使 用 以 太 网 帧 来 收发 数据 ， 因 此 Linux 能 像 处 理 有 线 网 络 接口 那样 处 理 无 线 网 络 接 
口 。 网 际 层 及 其 以 上 的 层次 都 是 一 样 的 ， 主要 不 同 就 在 于 物理 层 中 多 加 了 一 些 组 件 ， 如 频段 、 网 

络 ID 、 安 全 组 件 等 等 。 

无 线 网 络 的 配置 是 十 分 开放 的 ,不 像 有 线 设备 那样 拥有 很 强 的 自 适应 性 。 想 要 它 正 确 地 工作 ， 

Linux 需 要 更 多 的 配置 工具 。 

下 面 快速 浏览 一 下 无 线 网 络 多 出 的 组 件 。 

口 传输 细节 : 这 些 细节 都 是 物理 特性 ， 例 如 频率 。 

口 网 络 标识 : 因为 允许 一 套 设备 分 出 多 个 无 线 网 络 ， 所 以 必须 要 有 办 法 区 分 它们 。 每 个 无 
线 网 络 的 标识 就 是 它 的 服务 集 标识 ( Service Set Identifier， 又 称 “网 络 名 ”， 以 下 简称 
SSID )。 

口 管理 : 虽然 可 以 做 到 让 无 线 网 中 的 主机 直接 交流 ， 但 大 多 数 做 法 还 是 通过 无 线 接 入 点 来 

沟通 。 无 线 接 入 点 通常 桥接 着 有 线 网 络 ， 使 得 它 与 有 线 网 处 于 同一 个 网 络 中 。 

口 认证 : 你 可 能 会 想 限 制 无 线 网 的 准 入 。 想 做 到 这 点 ， 你 可 以 对 接 入 点 进行 配置 ， 以 要 求 

客户 输入 密码 或 其 他 认证 码 才 能 连 上 。 

口 加 密 : 除了 限制 连接 请 求 ， 一 般 我 们 还 会 对 电波 进行 加 密 以 保 信息 安全 。 

这 些 组 件 的 配置 和 工具 分 布 在 Linux 的 几 个 不 同 的 地 方 。 有 些 在 内 核 : Linux 有 一 套 无 线 的 扩 

展 程序 , 以 规范 用 户 进 程 对 硬件 的 访问 。 一 旦 讲 到 用 户 进程 , 那么 无 线 网 络 的 配置 就 变 得 复杂 了 ， 


图 灵 社 区 会 员 小 虎 (164142021@qq.com) 专 享 尊重 版 权 


184 第 9 章 网 络 与 配置 


所 以 大 部 分 人 更 喜欢 使 用 GUI 的 前 端 ( 例如 NetworkManager 的 桌面 应 用 ) 来 做 配置 。 尽 管 如 此 ， 
我 们 还 是 来 简单 看 一 下 无 线 网 配置 。 


9.23.1 iw 


你 可 以 通过 一 个 叫 i 的 工具 来 查看 和 改变 内 核 空 间 设备 与 网 络 的 配置 。 要 使 用 它 ， 你 得 先知 
道 设备 的 网 络 接口 名 ， 例 如 本 例 的 wlan0。 以 下 是 扫描 可 用 无 线 网 络 的 例子 。( 如 果 你 是 在 市 区 ， 
可 能 会 显示 大 量 可 用 无 线 网 络 。) 


# iw dev wlan0 scan 


注解 ”网 络 接 口 处 于 运行 状态 时 ， 这 条 命令 才 有 意义 ( 网 络 接 口 没 运行 的 话 ， 请 执行 ifconfig 
wlan0 up )， 而 网 际 层 的 参数 ( 例如 人 P 地 址 ) 则 不 用 设置 。 


如 果 网 络 接 口 已 接 入 到 某 个 无 线 网 络 ， 那 就 可 以 这 样 来 查看 网 络 的 详细 情况 : 


# iw dev wlan0 link 


其 中 的 MAC 地 址 是 你 所 连 的 接 人 点 的 MAC 地 址 。 


注解 iw 能 够 区 分 物理 设备 名 ( 如 phy0 ) 和 网 络 接口 名 ( 如 wlan0 )， 并 允许 你 调整 它们 的 各 种 
设置 。 你 甚至 还 可 以 给 一 个 物理 设备 创建 多 个 网 络 接口 。 然 而 ， 多 数 情况 下 ， 一 般 人 都 
只 会 与 网 络 接口 名 打交道 。 


以 下 命令 用 于 将 网 络 接口 连接 到 一 个 不 安全 的 无 线 网 络 : 


# iw wlanO connect network name 


能 连接 安全 的 网 络 固 然 最 好 。 那 么 对 于 不 太 安 全 的 有 线 等 效 加 密 协议 ( Wired Equivalent 
Privacy， 以 下 简称 WEP ) 来 说 ,你 可 以 在 用 iw 的 时 候 加 上 keys 参 数 。 然 而 ， 如 果 你 很 注重 安全 问 
题 ， 那 还 是 不 要 用 WEP。 


9.23.2 无线 网 络 安全 


Linux 主 要 依靠 一 个 叫 wpa_supplicant 守 护 进 程 来 管理 无 线 网 络 接口 的 认证 和 加 密 , 以 保证 无 
线 网 络 安全 。 这 个 守护 进程 可 以 处 理 WPA ( WiFi Protected Access，WiFi 网 络 安全 接 入 ) 和 WPA2 
的 认证 机 制 ， 以 及 几乎 所 有 的 无 线 网 络 加 密 技 术 。 首 次 启动 时 ， 它 会 读 取 配置 文件 ( 默认 是 
/etc/wpa_supplicant.conf )， 然 后 尝试 在 所 指定 的 网 络 中 向 接 入 点 提供 自己 的 信息 ， 并 与 其 建立 连 
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接 。 该 系统 的 帮助 文档 很 详尽 ,尤其 是 wpa_supplicant(1) 和 wpa_supplicant.conf(5) 帮 助手 册 中 都 有 
详细 描述 。 

每 次 需要 建立 连接 时 才 手 动 启动 该 守护 进程 ,是 很 繁琐 的 。 事实 上 , 正 是 因为 配置 文件 中 选 
项 很 多 ， 所 以 操作 起 来 很 乏味 。 更 糟糕 的 是 ，iw 和 wpa_supplicant 只 是 建立 了 物理 层 的 连接 ， 而 
没有 配置 好 网 际 层 的 。 所 以 你 可 以 使 用 NetworkManager 之 类 的 自动 化 工具 来 解决 问题 。 虽然 这 些 
工具 也 只 是 调用 其 他 程序 来 工作 , 但 是 它们 能 正确 地 安排 工作 步骤 ,参考 相应 的 配置 文件 ， 最 终 
连 好 你 的 无 线 网 络 。 


9.24 ”小结 


现在 你 应 该 理解 了 各 网 络 层 次 的 位 置 与 角色 ， 这 对 于 理解 Linux 网 络 工作 方式 、 实 施 网 络 配 
置 是 很 关键 的 。 虽然 我 们 讲 到 的 都 是 基础 ,但 物理 层 、 网 际 层 、 传 输 层 的 高 级 知识 都 能 由 此 引申 
而 来 。 所 有 层次 都 还 可 以 分 得 更 细 ， 就 像 你 刚才 看 到 的 无 线 网 络 的 物理 层 还 可 以 进一步 细 分 。 

本 章 讲解 了 大 量 针 对 内 核 的 操作 , 涉及 使 用 一 些 基本 的 用 户 空 间 控制 工具 修改 内 核 数据 结构 
(例如 路 由 表 )。 这 是 操作 网 络 的 传统 方式 。 然 而 ， 也 像 本 书 所 提 到 的 其 他 话题 一 样 ， 出 于 灵活 性 
的 考虑 ， 有 些 任务 是 不 适合 由 内 核 来 做 的 ， 于 是 我 们 使 用 用 户 空 间 的 工具 来 做 。 其 中 还 特别 提 到 
了 用 NetworkManager 来 监控 和 修改 内 核 的 配置 。 此 外 , 一 个 例子 就 是 动态 路 由 协议 , 例如 用 在 大 
型 互联 网 路 由 器 的 边界 网 关 协 议 ( Border Gateway Protocol， 以 下 简称 BGP )。 

现在 你 可 能 对 网 络 配置 有 点 厌倦 了 ， 下 面 我 们 谈 谈 使 用 网 络 吧 ， 这 就 与 应 用 层 相 关 了 。 
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网 络 应 用 与 服务 


本 章 探 索 基 本 的 网 络 应 用 一 一 运行 在 用 户 空间 的 应 用 
层 的 客户 端 与 服务 器 。 因 为 该 层 在 网 络 栈 的 顶层 , 靠近 用 户 ， 
所 以 你 会 觉得 本 章 内 容 比 上 一 章 更 好 理解 。 这 是 当然 的 ， 
为 你 天 天 都 使 用 网 页 浏览 器 或 电子 邮件 阅读 器 之 类 的 网 络 
应 用 客户 端 。 


客户 端 必须 与 它们 相应 的 网 络 服务 器 连接 起 来 才能 正常 工作 。Unix 服 务 器 有 很 多 种 形式 。 服 
务 顺 程序 直接 或 间接 地 监听 端口 。 另 外 ， 服 务 器 功能 各 异 , 但 没有 通用 的 配置 数据 库 。 大 多 数 服 
务 顺 通过 配置 文件 〈 尽 管 格式 不 统一 ) 来 定义 自身 的 行为 ， 并 使 用 操作 系统 的 syslog 服 务 来 记录 
日 志 。 接 下 来 我 们 会 介绍 一 些 常 见 的 服务 器 以 及 用 于 调试 的 工具 。 

网 络 客户 端 使 用 操作 系统 的 传输 层 协议 与 接口 , 所 以 我 们 必须 对 TCP 和 UDP 传输 层 有 基本 的 
了 解 。 下 面 就 来 看 一 些 网 络 应 用 ， 先 从 一 个 使 用 TCP 的 网 络 客 户 端 开始 。 


10.1 服务 的 基本 概念 
TCP 服 务 是 最 好 理解 的 概念 之 一 ， 因 为 它 建 立 在 简单 、 无 中 断 的 双 路 数据 流 之 上 。 或 许 最 佳 


的 解释 方式 ， 是 让 你 直接 通过 TCP 与 某 个 Web 服 务 器 的 80 端 口 沟通 ， 去 看 看 数据 是 如 何在 该 连接 
上 移动 的 。 例 如 ， 用 以 下 命令 连接 一 个 Web 服 务 器 : 


$ telnet www.wikipedia.org 80 


你 会 得 到 类 似 这 样 的 输出 : 


Trying some address... 
Connected to www.wikipedia.org. 
Escape character is '^]'. 
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现在 输入 : 


GET / HTTP/1.0 


敲 两 次 ENTER， 服 务 器 就 会 回复 一 推 HTML 文 本 ， 并 终止 本 连接 。 
这 个 测试 告诉 我 们 : 
口 远程 主机 那里 有 个 Web 服 务 器 进程 监听 着 TCP 端 口 80; 
口 telnet 是 初始 化 这 个 连接 的 客户 端 。 


注解 ”telnet 原本 是 用 于 登录 远程 主机 的 。 虽 然 非 Kerberos 的 telnet 是 一 种 不 安全 的 登录 服务 器 
(后 面 会 讲 到 )， 但 telnet 客 户 端 则 是 一 个 调试 远程 服务 的 有 用 工具 。telnet 只 用 到 TCP， 
不 会 用 到 UDP 或 其 他 传输 层 协议 。 如 果 你 要 的 是 多 用 途 网 络 客户 端 ， 可 以 考虑 使 用 
netcat， 我 们 会 在 10.5.3 节 介绍 它 。 


深入 剖析 


在 上 面 的 例子 中 ， 你 用 telnet 手 动 与 一 个 Web 服 务 器 进行 了 交互 ， 使 用 到 了 应 用 层 的 协议 
HTTP。 尽 管 你 平时 都 是 用 网 页 浏览 器 来 进行 此 类 连接 的 ,但 我 们 还 是 只 从 telnet 往 前 踏 一 小 步 ， 
使 用 一 个 命令 行 工具 来 看 看 怎样 与 HTTP 的 应 用 层 通 信 。 我 们 要 用 的 是 curl1， 以 及 一 个 记录 通信 
细节 的 选项 : 


$ curl --trace-ascii trace file http://www.wikipedia.org/ 


注解 ”你 的 发 行 版 可 能 没有 预 装 curl 包 ， 但 安装 该 包 对 你 来 说 应 该 不 是 难事 。 


你 会 得 到 大 量 的 HTML 输 出 。 忽 略 它们 (或 将 它们 重 定向 到 /dev/null )， 并 去 看 看 刚刚 创建 出 
来 的 文件 trace_file。 假 设 连接 成 功 ， 那 么 文件 的 开头 部 分 看 起 来 应 该 是 下 面 这 样 的 ， 表 明 刚 开始 
时 curl 尝 试 跟 该 服务 器 建立 TCP 连 接 : 


Info: About to connect() to www.wikipedia.org port 80 (#0) 
Info: Trying 10.80.154.224... == Info: connected 


至 此 你 看 到 的 一 切 都 是 发 生 在 传输 层 或 其 下 层 的 。 然 而 ， 如 果 连 接 成 功 了 , 那么 cur1 就 会 学 
试 发 送 请 求 ( 即 “报头 ” )) 这 里 就 开始 有 应 用 层 了 。 


=> Send header, 167 bytes (0xa7) 
0000: GET / HTTP/1.1 
0010: User-Agent: curl/7.22.0 (i686-pc-linux-gnu) libcurl/7.22.0 OpenS 
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0050: SL/1.0.1 zlib/1.2.3.4 libidn/1.23 librtmp/2.3 
007f: Host: www.wikipedia.org 

0098: Accept: */* 

00a5: 


上 例 第 一 行 是 cur1 的 调试 信息 输出 ,告诉 了 你 它 接 下 来 要 做 的 事情 。 剩 下 的 行 展 示 了 cur] 发 
送 给 服务 器 的 信息 。 粗 体 的 内 容 是 发 送 到 服务 器 的 。 开 头 的 十 六 进 制 数 只 是 一 个 调试 偏 移 量 , 告 


诉 你 收发 的 数据 有 多 少 。 


你 可 以 看 到 curl 先 发 了 一 个 GET 命 令 给 服务 器 ( 就 像 用 telnet 那 样 )， 接 着 是 一 些 有 关 服 务 咒 


的 额外 信息 以 及 一 个 空 行 。 然 后 服务 器 回应 了 ， 首 先是 它 的 报头 〈 粗 体 部 分 ) 


<= Recv header, 17 bytes (0x11) 

0000: HTTP/1.1 200 OK 

<= Recv header, 16 bytes (0x10) 

0000: Server: Apache 

<= Recv header, 42 bytes (0x2a) 

0000: X-Powered-By: PHP/5.3.10-1ubuntu3.9+wmf1 
-- Snip-- 


跟 之 前 那 段 输 出 很 像 ， “= 开头 的 行 是 调试 信息 ，0000: 是 偏 移 量 。 
服务 器 回应 的 报头 可 以 很 长 ， 然 后 ， 某 行 的 报头 出 现 了 我 们 请 求 的 内 容 ， 就 像 下 面 这 样 : 


<= Recv header，55 bytes (0x37) 

0000: X-Cache: cp1055 hit (16), cp1054 frontend hit (22384) 

<= Recv header, 2 bytes (0x2) 

0000: 

<= Recv data, 877 bytes (0x36d) 

0000: 008000 

0008: 《!DOCTYPE html>.<html lang="mul" dir="ltr">.<head>.<!-- Sysops: 
-- Snip-- 


该 输出 同样 展示 了 应 用 层 的 一 个 重要 特性 。 尽 管 调试 信息 里 有 Recv header 和 Recv data， 意 
味 着 服务 器 返回 的 信息 可 分 为 两 种 , 但 cur1 向 操作 系统 获取 这 两 种 信息 的 方法 却 没 有 不 同 ,， 操作 
系统 对 它们 的 处 理 方 式 也 没有 不 同 , 甚至 底层 网 络 对 它们 的 数据 包 的 处 理 方式 也 是 一 样 的 。 如 果 
说 有 不 同 ， 那 完全 是 在 用 户 空 间 的 cur1 内 部 。curl 读 取 报 头 的 时 候 ， 如 果 发 现 了 标志 HTTP 报 头 


结束 的 空 行 ( 即 中 间 的 两 个 字 节 )， 它 就 知道 接 下 来 将 是 真正 的 应 答 内 容 了 。 


在 服务 融 发 送 数据 方面 也 同样 如 此 。 服 务 器 并 不 区 分 发 给 操作 系统 的 报头 和 内 容 ,， 区 分 只 发 


生 于 用 户 空 间 的 服务 顺 程 序 。 


10.2 ”网 络 服务 器 


大 多 数 网 络 服务 器 跟 cron 之 类 的 服务 器 守护 进程 很 像 ， 只 不 过 网 络 服务 器 是 与 网 络 端口 进行 
交互 的 。 事实 上 , 我 们 在 第 7 章 讲 到 的 syslogd, 它 如 果 加 上 -r 选 项 的 话 , 就 会 接受 514 端 口 的 UDP 


数据 包 。 
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以 下 是 一 些 常见 的 网 络 服务 器 ， 在 你 系统 中 可 能 也 会 见 到 。 
口 httpd、apache、apache2: Web 服 务 器 。 
口 sshd: Secure shell 守 护 进 程 ( 见 10.3 节 )。 
口 postfix、qmail、sendmail: 邮件 服务 器 。 
口 cupsd: 打印 服务 器 。 
口 nfsd、mountd: 网 络 文 件 系 统 ( 文件 共享 ) 守护 进程 。 
口 smbd、nmbd: 文件 共享 守护 进程 ( 见 第 12 章 )。 
口 rpcbind: 远程 程序 调用 (RPC ) 端口 映射 服务 守护 进程 。 

大 多 数 网 络 服务 器 有 一 个 共同 的 特性 , 即 它们 通常 是 多 进程 的 。 其 中 至 少 有 一 个 进程 在 监听 
网 络 端口 ， 而 当 它 接收 到 一 个 新 的 连接 时 ， 就 会 使 用 fork() 来 创建 一 个 子 进 程 ， 负 责 那个 新 的 连 
接 。 该 子 进 程 ， 也 叫 辅助 进程 ， 会 随 着 连接 的 终止 而 终止 。 同 时 ， 监 听 进 程 会 继续 接收 连接 。 这 
样 ， 一 个 服务 器 就 能 轻松 地 处 理 多 个 连接 ， 一 般 不 会 有 什么 问题 。 

然而 ， 这 个 模型 也 会 有 一 些 异 常情 况 。 调 用 fork() 是 会 增加 系统 负担 的 ， 而 高 性 能 TCP 服 务 
器 (如 Apache Web 服 务 器 ) 能 在 启动 时 就 创建 一 定数 量 的 辅助 进程 ， 以 备 连接 需要 。 接 受 UDP 
包 的 服务 器 只 会 简单 地 接收 数据 并 对 其 做 出 反应 ， 它 们 不 需要 维持 连接 。 


10.3 SSH 


各 种 服务 器 的 工作 方式 都 是 有 些许 的 差别 的 。 现 在 我 们 来 详细 看 一 下 独立 的 Secure shell ( 以 
下 简称 SSH ) 服务 器 。SSH 是 最 常见 的 网 络 服务 应 用 之 一 ， 它 是 一 种 远程 连接 Unix 机 需 的 标准 。 
配置 好 之 后 ， 我 们 就 能 通 SSH 进 行 安全 的 shell 登 录 、 执 行 远程 程序 、 共 享 简单 的 文件 等 。 此 外 ， 
SSH 还 凭借 公 钥 认证 和 简单 的 会 话 加 密 ， 取 代 了 旧 的 、 不 安全 的 远程 登录 系统 telnet 和 rlogin。 
大 多 数 ISP 和 云 提 供 商 都 要 求 以 SSH 来 使 用 他 们 的 服务 , 另外 很 多 基于 Linux 的 网 络 设备 ( 如 NAS ) 
也 是 这 样 要 求 的 。OpenSSH (http://www.openssh.com/ ) 是 一 个 比较 流行 的 、 针 对 Unix 的 SSH 实 现 ， 
而 且 几 乎 所 有 的 Linux 发 行 版 也 预 装 了 它 。OpenSSH 的 客户 端 是 ssh， 服 务 器 是 sshd。SSH 协 议 有 
两 个 主要 版 本 : 1 和 2。OpenSSH 对 两 者 都 支持 ， 但 1 是 很 少 用 的 。 

SSH 的 功能 和 特性 使 它 能 做 到 以 下 事情 。 
口 对 密码 和 会 话 内 容 加 密 ， 保 护 你 不 受 窃听 困扰 。 
口 作为 其 他 网 络 连接 的 管道 ， 包 括 来 自 X Window 客 户 端的 连接 。X 会 在 第 14 章 详细 介绍 。 
口 几乎 所 有 操作 系统 都 可 用 SSH 连 接 。 
口 使 用 密 钥 做 主机 认证 。 


注解 ”作为 其 他 网 络 连接 的 管道 的 意思 是 ， 使 用 一 个 进程 将 某 个 连接 包装 并 转换 成 另 一 个 。 采 用 
SSH 包 装 XWindow 连 接 的 好 处 是 ， 它 在 提供 显示 环境 的 同时 ， 还 对 X 的 数据 进行 了 加 密 。 


但 SSH 也 有 缺点 。 其 中 一 个 就 是 ， 者 想 建 立 SSH 连 接 ， 你 必须 先知 道 远 程 主机 的 公 钥 ， 它 是 
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不 需要 通过 什么 保密 的 渠道 就 能 获得 的 ( 当然 你 也 可 以 手动 检查 它 的 真 假 )。 想 知道 那些 加 密 技 
术 的 运作 方式 ， 可 参考 Bruce Schneier 的 4pplied Cryptography: Protocols, Algorithms, and Source 
Codein C, 2nd edition( Wiley，1996 )。 深入 介绍 SSH 的 书 有 两 本 : Michael W. Lucas 的 SSH Mastery: 
OpenSSH, PuTTY Tunnels and Keys ( Tilted Windmill Press, 2012 ), 以 及 Daniel J. Barrett、 Richard E. 
Silverman 和 Robert G. Byrnes 的 8 已 The Secure Shell, 2nd edition ( O’Reilly, 2005 )。 


10.3.1 SSHD 服 务 器 


运行 sshd 需 要 一 个 配置 文件 以 及 主机 密 钥 。 大 多 数 发 行 版 都 将 配置 文件 放 在 /etc/ssh 配 置 目录 
中 ， 并 在 你 安装 它们 的 sshd 包 时 ， 尝 试 将 一 切 都 配置 好 。( 这 里 的 配置 文件 名 sshd_config 跟 客户 
端的 文件 名 ssh_config 很 容易 混淆 ， 请 注意 区 分 。) 

你 应 该 不 用 改变 sshd_config 里 的 任何 东西 ， 但 检查 一 下 是 可 以 的 。 这 个 文件 包含 了 键 值 对 ， 
如 下 列 片 段 所 示 


Port 22 

#Protocol 2,1 

#ListenAddress 0.0.0.0 
#ListenAddress :: 

HostKey /etc/ssh/ssh host key 
HostKey /etc/ssh/ssh host rsa key 
HostKey /etc/ssh/ssh host dsa key 


以 # 开 头 的 是 注释 ， 而 sshd_config 中 的 很 多 的 注释 都 暗示 了 默认 值 。sshd_config(5) 手 册 包 含 
了 所 有 可 选 值 的 解释 ， 而 以 下 这 些 是 最 重要 的 。 
口 HostKey file: 使 用 file 作 为 主机 密 钥 。( 主机 密 钥 是 短 的 。) 
口 LogLevel level: 按照 syslog 的 级 别 level 来 记录 信息 。 
口 PermitRootLogin value: value 为 yes 则 人 允许 超级 用 户 通过 SSH 登 录 ， 否 则 不 允许 。 
口 SyslogFacility name: 按 syslog 设 施 的 名 字 name 来 记录 信息 。 
口 X11Forwarding value: 若 value 为 yes 则 人 允许 X Window 客 户 端 被 SSH 管 道 接 驳 。 
口 XAuthLocation path: 设置 xauth 的 路 径 。 找 不 到 路 径 的 话 ，X11 的 SSH 管 道 将 无 法 工作 。 
如 果 xauth 不 在 /usr/bin 里 ， 则 需 写 明 xauth 的 完整 路 径 。 

主机 密 钥 

OpenSSH 有 三 套 主 机 密 钥 : 一 套用 于 版 本 1 的 协议 , 另 两 套用 于 版 本 2。 每 套 都 有 一 个 公 钥 ( 扩 
展 名 为 .pub 的 文件 ) 和 一 个 私 钥 ( 无 扩展 名 )。 不 要 让 任何 人 知道 你 的 私 钥 ,否则 就 有 被 入 侵 的 
危险 。 

SSH 版 本 1 只 有 RSA 密 钥 ， 而 版 本 2 则 有 RSA 和 DSA。RSA 和 DSA 都 是 公 钥 加 密 算法 。 密 钥 的 
文件 名 如 表 10-1 所 示 。 


图 灵 社 区 会 员 小 虎 (164142021@qq.com) 专 享 尊重 版 权 


10.3 SSH 191 


表 10-1 OpenSSH 密 钥 文 件 


文件 名 密 钥 类 型 
ssh_host rsa_ key RSA 私 钥 (版 本 2) 
ssh_ host rsa_key.pub RSA 公 钥 (版 本 2) 
ssh host dsa key DSA 私 钥 (版 本 2) 
ssh_ host dsa key.pub DSA 公 钥 (版 本 2) 
ssh_ host key RSA 私 钥 (版 本 1) 
ssh_host_key.pub RSA 公 钥 (版 本 1) 


一 般 你 不 用 自己 建立 密 钥 , 因为 OpenSSH 的 安装 程序 或 你 发 行 版 的 安装 脚本 会 为 你 做 好 , 但 
若 你 要 使 用 ssh-agent 之 类 的 程序 ， 你 还 是 需要 知道 密 钥 是 如 何 创 建 的 。 比 如 创建 SSH 版 本 2 的 密 
钥 ， 可 用 OpenSSH 自 带 的 ssh-keygen 程 序 : 


# ssh-keygen -t rsa -N '' -f /etc/ssh/ssh host Tsa_key 
# ssh-keygen -t dsa -N '' -f /etc/ssh/ssh host dsa_key 


版 本 1 则 是 : 


# ssh-keygen -t Tsal -N '' -f /etc/ssh/ssh host key 


SSH 服 务 需 与 客户 端 还 用 到 了 一 个 叫 作 ssh_ known hosts 的 密 钥 文件 , 里 面包 含 了 其 他 主机 的 
公 钥 。 如 果 你 要 使 用 基于 主机 的 认证 , 服务 器 端的 ssh_known_hosts 必 须要 包含 所 有 可 信 客 户 端的 
公 钥 。 了 解密 钥 文 件 有 助 于 你 更 换 机 器 。 当 你 从 头 给 机 器 安装 系统 时 , 你 可 以 用 回 旧 的 机 器 上 的 
密 钥 文 件 ， 这 样 用 户 就 能 跟 旧 的 密 钥 配 置 对 上 了 。 

开启 SSH 服 务 器 

尽管 大 多 数 发 行 版 都 带 有 SSH， 但 默认 却 不 会 启动 sshd 服 务 器 。 在 Ubuntu 和 Debian 上 ， 安 装 
SSH 服 务 右 就 会 创建 密 钥 、 启 动 服务 ， 并 在 开机 脚本 中 加 上 启动 SSH。 在 Fedora 上 ，sshd 是 预 装 
的 ， 但 默认 是 关闭 的 。 想 在 开机 时 启动 sshd， 可 以 用 chkconfig (但 这 并 不 会 让 服务 器 马上 启动 ， 
除非 你 用 service sshd start ): 


# chkconfig sshd on 


Fedora 一 般 会 在 sshd 初 次 启动 时 补 建 漏 掉 的 密 钥 文件 。 

如 果 你 还 没 装 好 init 的 支持 ， 就 用 root 来 运行 sshd， 以 启动 服务 器 。 而 一 旦 启动 ，sshd 就 会 在 
/Var/run/sshd.pid 记 下 自己 的 PID。 

你 还 可 以 在 systemd 或 用 inetd 以 套 接 字 单 元 来 启动 sshd， 但 这 不 是 个 好 方法 ， 因 为 服务 器 偶 
尔 会 产生 密 钥 文件 ， 这 个 进程 可 能 会 很 费时 间 。 


10.3.2 SSH 客 户 端 


想 登 录 远 程 主机 ， 运 行 : 
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$ ssh remote username@host 


如 果 你 在 本 机 的 账号 跟 远 程 的 一 样 ,可 以 省 略 remote_username@。 你 还 可 以 像 下 面 例子 一 样 


用 管道 符 来 连接 ssh 命 令 ， 将 一 个 叫 dir 的 目录 复制 到 另 一 台 主 机 : 


Pan 


$ tar zcvf - dir | ssh remote host tar zxvf - 


全 局 的 SSH 客 户 端 配置 文件 ssh_config 应 该 在 /etc/ssh 里 , 就 如 sshd_config 文 件 一 样 。 跟 服务 器 
配置 文件 类 似 ， 客 户 端 配置 文件 也 有 键 值 对 ， 但 你 应 该 不 用 去 改 它 。 

SSH 客 户 端 的 最 常见 问题 是 , 你 本 机 的 ssh_ known hosts 或 .ssh/known_ hosts 里 的 公 钥 跟 远 程 主 
机 的 不 匹配 ， 这 会 导致 如 下 报错 : 


66660000000000000000000000000000000000000000000000000000000 

@ WARNING: REMOTE HOST IDENTIFICATION HAS CHANGED! @ 
66660000000000000000000000000000000000000000000000000000000 

IT IS POSSIBLE THAT SOMEONE IS DOING SOMETHING NASTY! 

Someone could be eavesdropping on you right now (man-in-the-middle attack)! 
It is also possible that the RSA host key has just been changed. 

The fingerprint for the RSA key sent by the remote host is 
38:c2:f6:0d:0d:49:d4:05:55:68:54:2a:2f:83:06:11. 

Please contact your system administrator. 

Add correct host key in /home/wser/.ssh/known hosts to get rid of this message. 
Offending key in /home/wser/.ssh/known hosts:12 © 

RSA host key for host has changed and you have requested strict checking. 
Host key verification failed. 


通常 这 表示 远程 主机 的 管理 员 更 改 了 密 钥 (经常 是 在 更 换 硬件 时 发 生 )。 为 了 确认 状况 ,不 
妨 跟 管理 员 联 系 一 下 。 总 之 , 以 上 的 信息 告诉 你 , 错误 的 密 钥 是 在 用 户 的 .ssh/known_hosts 文 件 的 
第 12 行 ， 如 上 例 中 @ 处 所 示 。 

如 果 你 确定 没 问 题 ， 那 就 移 除 错误 的 那 行 ， 或 换 一 个 正确 的 公 钥 。 

SSH 文 件 传输 客户 端 

OpenSSH 包 含 了 文件 传输 程序 : scp 和 sftp。 这 两 个 命令 用 以 取代 旧 的 、 不 安全 的 命令 rcp 和 ftp。 

你 可 以 用 scp 在 本 机 和 远程 主机 之 间 传 输 文 件 ， 它 就 像 cp 命令 一 样 。 以 下 是 一 些 例子 。 


$ scp wser@host:file . 
$ scp file user@host:dir 
$ scp Wser1@host1: file user2@host2:dir 


sftp 程 序 就 好 比 是 命令 行 的 ftp 客 户 端 ， 它 有 get 和 put 命 令 。 远 程 主机 必须 装 好 sftp-server 
程序 ( 如 果 远 端 装 了 OpenSSH， 那 通常 都 会 囊 上 这 个 )。 


注解 ”如 果 你 对 功能 性 和 灵活 性 的 要 求 超越 了 scp 和 sftp 所 能 提供 的 (例如 你 经 常 进行 大 宗 文件 
的 传送 )， 那 就 试 下 rsync， 这 个 命令 会 在 第 12 章 讲 到 。 
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非 Unix 平 台 的 SSH 客 户 端 

所 有 流行 的 操作 系统 都 有 相应 的 SSH 客 户 端 ， 正 如 OpenSSH 网 站 上 列 出 的 〈http:/www. 
openssh.com/ )。 你 要 选 哪 个 呢 ? PuTTY 是 一 个 不 错 的 基本 Windows 客 户 端 ， 它 包含 了 安全 的 文件 
复制 程序 。MacSSH 适 用 于 Mac OS 9.x 及 以 下 版 本 。Mac OS X 是 基于 Unix 的 ， 也 包含 OpenSSH。 


10.4 守护 进程 inetd 和 xinetd 


为 每 种 服务 实现 独立 的 服务 器 好 像 并 不 太 高 效 。 每 个 服务 器 都 要 分 别 配置 端口 监听 、 访 问 控 
制 以 及 端口 设置 。 大 多 数 服务 的 配置 方式 都 是 一 样 的 ， 只 是 处 理 连 接 的 方式 不 同 。 

传统 的 解决 方法 是 使 用 inetd 守 护 进程 , 它 是 一 种 超级 服务 器 , 用 于 规范 网 络 端口 的 接 人 和 服 
务 器 程序 与 网 络 端口 之 间 的 接口 。 启 动 inetd 之 后 ， 它 会 读 取 自 己 的 配置 文件 ,并 监听 其 中 提 和 到 的 
网 络 端口 。 当 连接 到 来 时 ，inetd 就 会 新 开 一 个 进程 来 处 理 它 。 

xinetd 是 inetd 的 新 版 本 ， 它 提供 更 简单 的 配置 和 更 优秀 的 访问 控制 ， 但 xinetd 正 被 systemd 取 
代 ， 因 为 如 6.4.7 节 所 述 ，systemd 的 套 接 字 单元 能 提供 同样 的 功能 。 

尽管 inetd 将 被 淘汰 ,但 它 的 配置 能 告诉 我 们 建立 服务 的 要 素 。 如 下 列 配置 文件 /etc/inetd.conf 
所 示 ，sshd 也 能 被 inetd 发 起 ， 而 不 只 作为 一 个 独立 的 服务 器 存在 : 


ident stream tcp nowait root /usr/sbin/sshd sshd -i 


其 中 7 个 字段 从 左 至 右 含 义 分 别 如 下 所 示 。 

口 服务 名 称 : 来 自 /etc/services ( 见 9.14.3 节 )。 

口 套 接 字 类 型 : 通常 TCP 是 stream，UDP 是 dgram。 

口 协议 : 传输 协议 ， 通常 是 tcp 或 udp。 

口 数据 报 服务 器 行为 : UDP 可 选 wait 或 nowait。 其 他 传输 协议 应 该 用 nowait。 
口 用 户 : 运行 该 服务 的 用 户 。 加 上 .group 的 话 ， 可 以 指定 群 组 。 

口 可 执行 程序 : inetd 为 应 付 该 服务 而 发 起 的 程序 。 

口 参数 : 可 执行 程序 的 参数 。 第 一 个 参数 是 该 程序 的 名 字 。 


TCP 封 装 器 : tcpd、/etc/hosts.allow 和 /etc/hosts.deny 


在 低层 次 防火 墙 流 行 之 前 ,很 多 管理 员 都 用 TCP 封 装 器 的 库 和 守护 进程 来 操控 网 络 服务 。 具 
体 做 法 是 , 让 inetd 运 行 tcpd 程 序 , 而 tcpd 在 接收 连接 时 会 查看 /etc/hosts.allow 和 /etc/hosts.deny 文 件 
中 的 访问 控制 列表 。tcpd 会 记 下 该 连接 ， 并 在 审查 通过 后 ， 将 连接 交 给 最 终 的 服务 程序 。( 虽然 
仍 有 系统 采用 TCP 封 装 器 ， 但 因为 它 的 使 用 率 已 不 高 ， 所 以 我 们 不 会 详细 介绍 。) 


10.5 ”诊断 工具 
下 面 来 看 下 一 些 比 较 有 用 的 针对 应 用 层 的 诊断 工具 。 它们 有 些 还 会 涉及 传输 层 和 网 际 层 ， 
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为 应 用 层 最 终 还 是 需要 这 些 底层 支撑 。 
如 第 9 章 讲 到 的 ，netstat 是 一 个 基本 的 网 络 服务 调试 工具 ， 能 显示 一 些 传 输 层 和 网 际 层 的 统 
计 信 息 。 表 10-2 罗 列 了 一 些 考察 连接 的 有 用 选项 。 


表 10-2 一 些 有 用 的 netstat 报 告 选项 


选 项 描 述 
-t 打印 TCP 端 口 信息 
-U 打印 UDP 端口 信息 
-1 打印 监听 中 的 端口 
-a 打印 所 有 活动 中 的 端口 
-n 取消 域名 查找 (能 加 快速 度 ， 就 算 没 使 用 DNS 也 有 效 ) 
10.5.1 lsof 


在 第 8 章 我 们 讲 过 ，1sof 能 够 跟踪 打开 的 文件 ， 但 其 实 它 还 可 以 列 出 正在 使 用 或 监听 端口 的 
程序 。 想 完整 列 出 这 些 程序 ， 可 以 运行 以 下 命令 : 


# lsof -i 


知 以 普通 用 户 身 份 运行 ， 它 只 会 显示 出 该 用 户 的 进程 。 而 以 root 吴 份 运行 的 话 ， 就 会 列 出 全 
部 进程 ， 像 下 面 这 样 : 


COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME 


rpcbind 700 root 6u IPv4 10492 Oot0 UDP *:sunrpc 

rpcbind 700 root 8u IPv4 10508 Oto TCP *:sunrpc(LISTEN) 

avahi-dae 872 avahi 13u IPv4 21736375 ot0 UDP *:mdns 

cupsd 1010 root 9u IPv6 42321174 oto TCP ip6-localhost:ipp (LISTEN) 

ssh 14366 juser 3u IPv4 38995911 oto TCP thishost.local:55457-> 
somehost.example.com:ssh (ESTABLISHED) 

chromium- 26534 juser 8r IPv4 42525253 oto TCP thishost.local:41551-> 


anotherhost .example.com:https (ESTABLISHED) 


这 个 例子 展示 了 服务 器 程序 和 客户 端 程序 的 用 户 和 PID: 从 顶部 的 旧式 RPC 服 务 ， 到 avahi 提 
供 的 组 播 DNS 服 务 , 甚至 还 有 兼容 了 Pv6 的 打印 机 服务 ( cupsd )。 最 后 两 条 是 客户 端 连 接 : 一 个 SSH 
连接 和 一 个 Chromium 网 页 浏览 器 。 因 为 输出 可 能 会 很 长 , 所 以 最 好 是 加 上 过 滤器 (下面 会 讲 到 )。 

lsof 与 netstat 相 似 的 一 点 是 , 它 试 图 将 每 个 IP 反 向 解析 成 主机 名 ， 这 会 减 慢 结 果 的 输出 。 我 
们 可 以 使 用 -n 选 项 来 阻止 它 这 么 做 : 


# lsof -n -i 


你 还 可 以 用 -Pp 取消 对 /etc/services 的 端口 名 查找 。 
按 协 议和 端口 来 过 滤 
如 果 你 正在 寻找 一 个 特定 的 端口 (假设 你 知道 有 个 进程 在 使 用 该 端口 ,而 你 想 知道 是 哪个 进 
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程 )， 那 就 执行 : 


# lsof -i:port 


完整 的 语法 如 下 : 


# lsof -iprotocol@host:port 


protocol 、@host 、 和 :port 参 数 都 是 可 选 的， 它们 会 对 1sof 的 输出 进行 过 滤 。 就 如 大 多 数 的 
网 络 工具 一 样 , host 和 port 可 以 填 名 字 或 数字 。 例 如 你 只 想 查看 TCP 端 口 80( HTTP 端口 ) 的 连接 ， 
就 用 : 


# lsof -iTCP:80 


按 连接 状态 来 过 滤 
lsof 还 有 个 特别 好 用 的 过 滤 右 一 一 连接 状态 。 例如 ,只 查看 正在 监 昕 TCP 端口 的 进程 , 就 用 : 


# lsof -iTCP -sTCP:LISTEN 


这 个 命令 能 让 你 概览 运行 中 的 网 络 服务 器 进程 。 然 而 ， 因 为 UDP 服务 器 并 不 维持 连接 ,所 以 
你 要 用 -iuDpP 来 查看 服务 器 和 客户 端 。 通 常 这 不 是 什么 问题 ， 因 为 一 般 你 系统 中 不 会 有 太 多 UDP 
服务 器 。 


10.5.2 tcpdump 10 


如 果 你 想 明确 地 知道 你 的 网 络 上 有 什么 在 流通 ， 你 可 用 tcpdump 将 网 络 接口 置 于 混杂 模式 ， 并 
向 你 报告 每 一 个 通过 的 数据 包 。 如 下 所 示 , 不 带 参数 地 运行 tcpdump, 就 包含 了 了 ARP 请求 和 Web 连 接 。 


# tcpdump 

tcpdump: listening on etho 

20:36:25.771304 arp who-has mikado.example.com tell duplex.example.com 
20:36:25.774729 arp reply mikado.example.com is-at 0:2:2d:b:ee:4e 
20:36:25.774796 duplex.example.com.48455 > mikado.example.com.www: 9 
3200063165:3200063165(0) win 5840 <mss 1460,sackOKk,timestamp38815804[|tcp]> 
(DF) 

20:36:25.779283 mikado.example.com.www > duplex.example.com.48455: S 
3494716463:3494716463(0) ack 3200063166 win 5792 <mss1460,sackOK,timestamp 
4620[ |tcp]> (DF) 

20:36:25.779409 duplex.example.com.48455 > mikado.example.com.www: .ack 1 win 
5840 <nop,nop, timestamp 38815805 4620> (DF) 

20:36:25.779787 duplex.example.com.48455 > mikado.example.com.www: P 1:427(426 ) 
ack 1 win 5840 <nop,nop,timestamp 38815805 4620> (DF) 

20:36:25.784012 mikado.example.com.www > duplex.example.com.48455: .ack 427 

win 6432 <nop,nop,timestamp 4620 38815805> (DF) 

20:36:25.845645 mikado.example.com.www > duplex.example.com.48455: P 1:773(772) 
ack 427 win 6432 <nop,nop,timestamp 4626 38815805> (DF) 
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20:36:25.845732 duplex.example.com.48455 > mikado.example.com.www: .ack 773 
win 6948 <nop,nop,timestamp 38815812 4626> (DF) 


9 packets received by filter 
0 packets dropped by kernel 


你 可 以 加 入 过 滤器 ， 以 让 tcpdump 的 内 容 更 精确 。 过 滤器 可 以 是 源 主机 、 目 标 主 机 、 网 络 、 
以 太 网 地 址 、 各 层 协 议 等 等 。 各 种 数据 包 协 议 中 ，tcpdump 能 认 出 的 有 : ARP、RARP、ICMP、 
TCP、UDP、IP、IPv6、AppleTalk、IPX。 例 如 ， 让 tcpdump 只 输出 TCP 数 据 包 ， 可 运行 : 


# tcpdump tcp 


想 看 网 页 包 和 UDP 包 ， 运 行 : 


# tcpdump udp or port 80 


注解 ”如 果 是 需要 进行 大 量 的 数据 包 嗅 听 ， 可 用 诸如 Wireshark 类 的 GUI 工具 来 代替 tcpdump。 


表达 元 
在 上 面 的 例子 中 ，tcp 、udp 和 port 80， 都 是 表达 元 。 表 10-3 列 举 了 最 重要 的 一 些 表 达 元 。 


表 10-3 tcpdump 表 达 元 


表达 元 指定 包 
tcp TCP 包 
udp UDP 包 
port port 来 自 (去 往 ) 端口 port 的 TCP 包 和 (或 ) UDP 包 
host host 来 自 〈 去 往 ) 主机 host 的 包 
net network 来 自 (去 往 ) 网 络 network 的 包 


运算 符 

上 例 中 的 or 是 一 个 运算 符 。tcpdump 有 很 多 种 运算 符 (例如 and 和 ! )， 并 且 可 以 将 运算 符 括 起 
来 。 如 果 你 要 用 tcpdump 来 做 一 些 复杂 的 工作 ， 请 仔细 阅读 它 的 帮助 手册 ， 尤 其 是 关于 表达 元 的 
那 一 他。 

什么 时 候 不 该 用 tcpdump 

使 用 tcpdump 时 要 格外 留心 。 本 节 前 面 的 例子 中 只 打印 出 了 TCP ( 传输 层 ) 和 IP ( 网际 层 ) 的 
报头 的 信息 ， 但 你 可 以 指定 tcpdump 打 印 出 整个 数据 包 的 内 容 。 尽 管 很 多 网 络 工 具 都 有 这 样 的 功 
能 ， 但 你 最 好 是 不 要 随便 嗅 听 网 络 ， 除 非 该 网 络 是 你 所 有 的 。 


10.5.3 netcat 


如 果 你 觉得 用 telnet host port 连 接 远程 主机 不 够 灵活 ， 试 试 netcat (或 nc )。netcat 可 以 与 
TCP 和 UDP 端口 通信 ,指定 本 地 端口 ， 监听 端 口 ， 扫 描 端 口 ， 对 网 络 输入 输出 重 定向 到 标准 输入 
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输出 等 等 。 用 netcat 连 接 TCP 端 口 ， 如 下 所 示 : 


$ netcat host port 


netcat 只 在 对 方 关闭 连接 时 终止 ， 所 以 如 果 你 用 netcat 接 收 标准 输入 ， 就 会 有 点 麻烦 。 你 可 
以 使 用 CTRL-C 来 随时 关闭 连接 。( 如 果 你 希望 由 标准 输入 流 来 决定 程序 和 网 络 连接 的 关闭 , 可 以 
改 用 sock 程 序 。) 

想 监听 某 个 端口 ， 可 执行 以 下 命令 : 


$ netcat -1 -p port number 


10.5.4 ”扫描 端口 


有 了 时 你 可 能 想 知道 你 网 络 中 的 机 器 正 提供 着 什么 服务 , 或 哪个 IP 正 在 被 使 用 , 这 时 你 可 以 用 
网 络 映射 器 (Network Mapper， 以 下 简称 Nmap ) 程序 来 扫描 并 列举 出 一 台 机 器 (或 一 个 网 络 中 
的 机 器 ) 的 开放 端口 。 大 多 数 的 发 行 版 都 有 自己 的 Nmap 包 , 或 者 你 可 以 从 http://www.insecure.org/ 
获取 。( 想 了 解 Nmap 的 功能 ， 请 看 帮助 手册 及 在 线 资 源 。) 

在 列举 你 机 器 的 端口 时 ， 至 少 从 这 样 两 个 不 同 的 角度 来 运行 Nmap 程 序 会 更 好 : 从 本 机 和 从 
另 一 台 机 器 〈 可 能 是 本 地 网 络 之 外 的 )。 这 样 做 可 以 看 到 你 防火 墙 屏蔽 了 什么 。 


警告 ”如果 你 想 用 Nmap 扫 描 的 网 络 是 由 他 人 控制 的 ， 那 就 需要 获得 准许 。 网 络 管理 员 通 常会 监 
察 这 种 端口 扫描 ， 并 屏蔽 那些 发 出 扫描 的 机 器 。 


运行 nmap host 来 对 一 个 主机 进行 端口 扫描 ， 例 如 : 


$ nmap 10.1.2.2 

Starting Nmap 5.21 ( http://nmap.org ) at 2015-09-21 16:51 PST 
Nmap scan report for 10.1.2.2 
Host is up (0.00027s latency). 
Not shown: 993 closed ports 
PORT STATE SERVICE 

22/tcp open ssh 

25/tcp open smtp 

80/tcp open http 

111/tcp open rpcbind 
8800/tcp open unknown 
9000/tcp open cslistener 
9090/tcp open zeus-admin 


Nmap done: 1 IP address (1 host up) scanned in 0.12 seconds 


如 你 所 见 ， 这 里 有 很 多 服务 开启 了， 其 中 不 少 服务 是 多 数 linux 版 本 默认 关闭 的 。 事实 上 , 通 
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常 是 默认 开启 的 就 只 有 111 端 口 ， 即 rpcbind 端 口 。 
10.6 ”远程 程序 调用 


上 节 提 到 的 rpcbind 服 务 是 什么 意思 呢 ?RPC 意 指 远程 程序 调用 ( Remote Procedure Call ), 是 
应 用 层 中 较 低 层 的 一 个 系统 。 它 是 为 了 方便 程序 员 访问 网 络 应 用 而 设计 的 , 能 使 本 地 程序 调用 远 
程 程序 ( 按 程序 号 来 标识 )， 让 远程 程序 返回 结果 码 或 信息 。 

RPC 的 实现 需要 用 到 传输 层 协议 ， 如 TCP 和 UDP。 它 需要 一 种 特别 的 中 介 服 务 来 将 程序 号 与 
TCP 和 UDP 的 端口 号 对 应 起 来 。 这 种 服务 就 是 zpcbind， 运 行 RPC 服 务 就 需要 用 到 它 。 

想 看 你 计算 机 运行 了 什么 RPC 服 务 ， 可 执行 : 


$ rpcinfo -p localhost 


RPC 是 一 种 难以 消亡 的 协议 。 网 络 文件 系统 ( Network File System， 以 下 简称 NFS ) 和 网 络 
信息 服务 (Network Information Service， 以 下 简称 NIS ) 就 用 得 到 它 ， 但 单机 环境 下 是 不 需要 这 
些 服务 的 。 当 你 以 为 你 已 经 对 rpcbind 不 会 再 有 任何 需要 时 ， 就 会 有 些 依赖 它 的 东西 出 现 ， 例 如 
GNOME 的 文件 访问 监控 (File Access Monitor， 以 下 简称 FAM )。 


10.7 网 络 安全 


因为 Linux 是 PC 平台 上 风行 的 Unix 系 统 ， 尤 其 是 它 被 广泛 用 作 网 页 服务 器 ， 所 以 它 也 招致 了 
很 多 黑客 攻击 。9.21 节 已 介绍 过 了 防火 墙 , 但 网 络 安全 的 话题 不 止 那些 。 

网 络 安全 带 来 了 两 个 极端 : 真心 想 攻 破 系统 的 人 ( 不管 是 为 了 钱 还 是 为 了 好 玩 ) 和 精心 设计 
防御 方案 的 人 ( 这 个 也 很 有 利 可 图 )。 幸 好 ， 你 不 需要 了 解 太 多 东西 来 维持 系统 的 安全 。 这 里 有 
一 些 经 验 法 则 。 

口 打开 的 服务 越 少 越 好 : 黑客 不 能 攻击 你 机 器 上 不 存在 的 服务 。 如 果 你 知道 有 哪个 服务 是 

你 不 需要 的 ， 那 就 别 打 开 它 ， 等 你 真正 用 到 那个 服务 时 再 打开 。 

口 防火 墙 屏蔽 得 越 多 越 好 : Unix 系 统 有 一 些 内 部 服务 是 你 可 能 不 知道 的 (例如 用 于 RPC 端 口 
映射 的 TCP 端 口 111 ), 因此 也 别 让 其 他 机 器 知道 它们 的 存在 。 跟 踪 和 规范 本 机 的 服务 是 很 
困难 的 ， 因 为 监听 的 程序 和 被 监听 的 端口 错综复杂 。 为 避免 黑客 发 现 你 系统 上 的 内 部 服 
务 ， 请 使 用 有 效 的 防火 墙 规则 ， 并 为 路 由 器 安装 防火 墙 。 

口 记录 你 提供 给 互联 网 的 服务 : 如 果 你 运行 着 SSH 服 务 器 、Postfix 或 类 似 的 东西 ， 请 保持 你 

软件 的 更 新 ， 以 及 使 用 合适 的 安全 警报 ( 详 见 10.7.2 节 )。 

口 让 服务 器 使 用 “长 期 支持 ”的 系统 版 本 : 安全 团队 一 般 在 稳定 、 有 文 持 的 系统 版 本 上 才 

能 集中 精力 工作 。 开 发 版 或 测试 版 如 Debian Unstable 和 Fedora Rawhide 不 太 受 他 们 关注 。 

口 账号 不 要 发 给 不 用 的 人 : 通过 本 地 账号 获取 超级 用 户 的 权限 ， 比 远程 人 侵 要 简单 得 多 。 
事实 上 , 大 多 数 系统 上 的 软件 都 有 这 样 那样 的 漏洞 ， 只 要 你 能 登录 shell, 就 有 可 能 获取 超 
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级 用 户 的 权力 。 不 要 指望 你 的 朋友 懂得 如 何 保护 密码 ( 或 懂得 使 用 复杂 的 密码 )。 

口 避免 安装 可 疑 的 二 进 制 包 : 它们 可 能 包含 木马 。 

进行 安全 保护 的 方法 基本 就 这 些 。 但 为 什么 要 这 么 做 呢 ? 因为 有 以 下 三 种 基本 的 网 络 攻击 。 

口 全 面 威胁 : 意思 是 获取 了 超级 用 户 的 权限 (对 一 台 机 器 完全 掌控 )。 黑 客 可 以 通过 服务 攻 
击 ， 例 如 缓存 溢出 、 接 管 一 个 没什么 保护 措施 的 账号 或 利用 一 个 写 得 不 太 好 的 setuid， 来 
做 到 “全 面 威 胁 ”。 

口 拒绝 服务 ( Denial-of-service， 简称 DoS ) 攻击 : 这 使 得 机 器 无 法 继续 提供 服务 ， 或 无 需 通 

过 登录 就 用 某 些 方法 造成 机 器 故障 。 这 种 攻击 更 难 防 范 ， 但 很 容易 应 对 。 

口 恶意 软件 : Linux 用 户 大 多 对 亚 意 软件 (如 电子 邮件 蠕虫 和 病毒 ) 免疫 ， 只 因为 他 们 的 电 
子 邮 件 客户 端 不 会 春 到 运行 附件 里 的 程序 。 但 Linux 恶 意 程序 确实 存在 。 请 幻 从 陌生 的 地 
方 下 载 并 安装 二 进 制 软件 。 


10.7.1 典型 漏洞 


有 两 种 重要 的 漏洞 是 需要 担心 的 : 直接 攻击 和 嗅 探 明文 密码 。 所 谓 直接 攻击 ， 就 是 摆 明 要 攻 
陷 一 台 机 器 。 最 常见 的 做 法 是 利用 缓存 溢出 。 该 漏洞 是 因为 粗心 的 程序 员 没 检查 数组 边界 而 造成 
的 。 攻 击 考 在 一 大 堆 数 据 中 编造 一 个 栈 帧 ， 然 后 送 到 远程 服务 器 ， 并 期 望 它 溢出 而 覆盖 了 程序 ， 
最 终 导致 服务 器 执行 了 栈 帧 中 的 东西 。 尽 管 这 不 太 容 易 ， 但 却 很 容易 复制 。 

第 二 种 漏洞 , 即 嗅 探 明 文 密码 , 是 指 获取 网 络 上 明文 传输 的 密码 。 一 旦 攻击 者 拿 到 你 的 密码 ， 
那 你 就 玩 完 了 。 从 那 开 始 , 攻击 者 就 会 直接 登 人 ,尝试 获取 超级 用 户 的 权限 (这 比 远程 攻击 要 简 
单 )， 或 以 该 机 器 攻击 其 他 机 器 ， 或 用 其 他 机 器 攻击 该 机 器 。 


注解 ”如 果 你 有 些 服务 是 不 带 加 密 功 能 的 ， 那 就 试 试 Stunnel (http://www.stunnel.org/ )。 它 
是 一 个 加 密封 装 器 数据 包 ， 就 像 TCP 封 装 器 一 样 。 跟 tcpd 一 样 ，Stunnel 擅 长 封装 inetd 
服务 。 


有 些 服 务 因为 设计 缺陷 而 经 常 成 为 攻击 目标 。 例 如 以 下 这 些 服 务 ， 你 应 该 停 用 它们 ( 其 实 大 
多 数 系统 都 默认 关闭 的 )。 
口 ftpd: 不 管 什么 原因 ， 所 有 的 FTP 服 务 器 都 存在 漏洞 。 除 此 之 外 ， 大 多 数 FTP 服 务 器 都 用 
明文 密码 。 如 果 你 要 在 机 器 之 间 移 动 文件 ， 考 虑 下 基于 SSH 的 方案 或 rsync 服 务 器 。 
口 telnetd、rlogind、rexecd: 它们 都 把 会 话 内 容 (包括 密码 ) 用 明文 传输 。 不 要 使 用 它们 ， 
除非 你 有 Kerberos 版 本 。 
口 fingerd: 黑客 可 以 通过 finger 服 务 获 取 用 户 列 表 和 其 他 信息 。 


10.7.2 ”安全 资源 
以 下 是 三 个 不 错 的 安全 网 站 。 
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口 http:/www.sans.org/: 提供 培训 、 服 务 、 免 费 的 高 危 漏 洞 周报 、 安 全 策略 样板 等 等 。 
口 http://www.cert.org/: 这 里 介绍 最 危险 的 漏洞 。 
口 http://www.insecure.org/: 这 里 有 Nmap 和 各 种 网 络 开发 测试 工具 , 比 其 他 网 站 做 得 更 详尽 、 
更 开放 。 

如 果 你 对 网 络 安 全 有 兴趣 ， 你 应 该 学 习 一 下 传输 层 安全 ( Transport Layer Security，TLS ) 及 
其 前 身 一 一 SSL ( 安全套 接 层 )。 这 些 用 户 空间 的 层次 被 加 插 到 客户 端 和 服务 器 ， 用 公 钥 加 密 和 
认证 来 支援 网 络 通 信 。Davies 的 Implementing SSL/TLS Using Cryptography and PKI ( Wiley, 2011) 
是 本 不 错 的 指南 。 


10.8 ”前瞻 


如 果 你 对 一 些 复杂 的 网 络 服务 器 感 兴趣 ， 这 里 有 两 个 常见 的 : Apache 网 页 服务 器 和 Postfix 邮 
件 服 务 器 。 尤 其 是 Apache,， 它 安装 简单 ， 而 且 大 多 数 系 统 版 本 都 有 它 的 安装 包 。 如 果 你 的 机 器 装 
有 防火 墙 或 NAT 路 由 器 ， 你 可 以 不 用 担心 安全 问题 ， 尽 情 体 验 。 

在 前 面 的 几 章 里 ,我们 逐渐 从 内 核 空间 过 渡 到 了 用 户 空 间 。 本 章 只 有 少量 工具 是 与 内 核 交 互 
的 ,如 tcpdump。 本 章 余下 的 部 分 讲解 套 接 字 如 何 将 内 核 的 传输 层 与 用 户 空间 的 传输 层 接合 起 来 。 
这 是 一 个 进 阶 内 容 ， 程 序 员 可 能 比较 感 兴趣 ， 所 以 无 兴趣 的 话 可 跳 到 下 一 章 。 


10.9 套 接 字 : 进程 与 网 络 的 通信 方式 


现在 我 们 稍微 转变 一 下 话题 ， 看 看 进程 是 怎样 从 网 络 读数 据 ， 以 及 怎样 向 网 络 写 数据 的 。 向 
建立 好 的 连接 读 写 数据 是 很 容易 的 ， 只 需要 做 一 些 系统 调用 ( 参考 recv(2) 和 send(2) 帮 助手 册 ) 工 
作 。 从 进程 的 角度 来 看 ,或许 最 重要 的 是 要 知道 在 做 系统 调用 时 如 何 与 网 络 对 应 。 在 Unix 上 ， 进 
程 是 用 套 接 字 来 标识 与 网 络 通信 的 时 机 与 方式 的 。 套 接 字 是 进程 通过 内 核 访 问 网 络 的 接口 , 它 代 
表 用 户 空间 与 内 核 空间 的 边界 。 它 也 常 被 用 于 进程 间 通 信 ( Interprocess Communication， 以 下 简 
称 IPC )。 

因为 进程 需要 以 不 同 的 方式 访问 网 络 ， 所 以 套 接 字 也 分 不 同 种 类 。 例 如 ，TCP 连 接 会 用 流 式 

套 接 字 ( 程序 员 称 之 为 SOCK_STREAM )， 而 UDP 连接 则 用 数据 报 套 接 字 ( SOCK_DGRANM )。 
建立 网 络 套 接 字 有 点 复杂 ， 因 为 你 有 时 需要 知道 套 接 字 类 型 、 地 址 、 端 口 、 传 办 协议 。 然 
而 ， 当 所 有 初始 的 细节 上 整理 好 后 ， 服 务 器 就 能 用 相应 的 标准 模型 来 处 理 网 络 通信 了 。 
图 10-1 的 流程 展示 了 服务 器 处 理 收 到 的 流 式 套 接 字 连 接 。 注 意 ， 这 种 服务 器 涉及 到 两 种 套 
接 字 : 监听 套 接 字 和 读 写 套 接 字 。 主 进程 用 监听 套 接 字 在 网 络 中 寻找 连接 。 当 一 个 新 的 连接 到 
来 ， 主 进程 就 用 accept() 系 统 调 用 来 接收 该 连接 ， 它 能 为 连接 创建 专用 的 读 写 套 接 字 。 接 着 主 
进程 用 fork() 创 建 一 个 新 的 子 进程 来 处 理 该 连接 。 最 终 ， 监 听 套 接 字 继续 监听 ， 为 主 进 程 带 来 
更 多 连接 。 


图 灵 社 区 会 员 小 虎 (164142021@qq.com) 专 享 尊重 版 权 


10.10 ”Unix 域 套 接 字 201 


源 进 程 


监听 器 
行 监听 


子 进 程 来 处 理 accept() 所 产生 的 ; 
交 套 接 字 


图 10-1 ”接受 和 处 理 新 连接 的 一 种 方法 


如 果 你 是 个 程序 员 ， 并 且 想 知道 如 何 使 用 套 接 字 接 口 ， 可 看 一 下 W. Richard Stephens 、Bill 
Fenner 和 Andrew M. Rudoff 所 著 Unix Network Programmin, Volume 1, 3rd edition ( Addison-Wesley 
Professional，2003 )， 这 是 一 本 经 典 教 程 ， 第 二 卷 也 讲 到 了 进程 间 通 信 。 


10.10 ”Unix 域 套 接 字 


使 用 网 络 设施 的 应 用 不 需要 将 两 台 分 隔 的 主机 牵扯 在 一 起 。 很 多 应 用 都 是 用 像 客 户 端 - 服 务 
器 或 点 对 点 那样 的 机 制 建立 起 来 的 ， 同 一 台 机 器 上 的 进程 则 使 用 IPC ( 进程 间 通 信 ) 来 协商 有 哪 
些 工作 要 做 ,以 及 由 谁 来 做 。 例 如 , 回想 一 下 systemd 和 NetworkManager 这 样 的 守护 进程 利用 D-Bus 
来 监控 和 应 对 系统 事件 的 做 法 。 

进程 间 的 通信 可 以 使 用 本 地 主机 (127.0.0.1 ) 来 做 常规 的 网 络 通信 ， 但 我 们 一 般 使 用 另 一 种 
特别 的 套 接 字 ,这 种 套 接 字 在 第 三 章 中 简单 提 到 过 ,， 叫 Unix 域 套 接 字 。 进 程 与 Unix 域 套 接 字 的 连 
接 几 乎 与 网 络 套 接 字 连 接 一 样 : 进程 可 以 监听 和 接收 套 接 字 上 的 连接 , 还 可 以 选择 不 同类 型 的 套 
接 字 来 实现 TCP 式 或 UDP 式 的 工作 方式 。 


中 


注解 ”要 记 住 ，Unix 域 套 接 字 并 不 是 网 络 套 接 字 ， 其 背后 也 没有 网 络 。 使 用 它 不 需要 配置 网 络 。 
而 且 ，Unix 域 套 接 字 不 需要 非得 与 套 接 字 文 件 绑 定 。 进 程 可 以 创建 非 命名 Unix 域 套 接 字 ， 
并 与 其 他 进程 分 享 它 的 地 址 。 


10.10.1 对 开发 者 的 好 处 


开发 者 们 喜欢 Unix 域 套 接 字 的 以 下 两 点 。 第 一 , 开发 者 可 以 通过 管理 套 接 字 文件 的 访问 权限 
来 管理 Unix 域 套 接 字 的 访问 权限 。 也 就 是 说 , 不 能 访问 某 个 套 接 字 文件 的 进程 ， 也 就 不 能 使 用 该 
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套 接 字 。 此 外 ， 因 为 它 没有 网 络 交互 ， 所 以 更 简单 ， 更 能 减少 网 络 攻击 的 机 会 。 例 如 ， 你 可 以 在 
/varrun/dbus 里 找到 D-Bus 的 套 接 字 文 件 : 


$ ls -1 /var/run/dbus/system bus_socket 
SIWXIWXIWX 1 root root 0 Nov 9 08:52 /var/run/dbus/system bus_socket 


第 二 ， 因 为 Linux 内 核 与 Unix 域 套 接 字 通 信 并 不 需要 经 历 网 络 层次 ， 所 以 性 能 会 比 网 络 套 接 
字 好 。 

为 Unix 域 套 接 字 写 代码 跟 支 持 一 般 的 网 络 套 接 字 没 多 大 不 同 。 因 为 它 的 好 处 十 分 明显 ， 所 以 
有 些 网 络 服务 器 会 同时 提供 网 络 套 接 字 和 Unix 域 套 接 字 的 连接 。 例 如 ，MySQL 的 数据 库 服务 器 
mysqld 能 接受 远 端 的 连接 ， 同 时 也 以 /var/run/mysqld/mysqld.sock 提 供 Unix 域 套 接 字 。 


10.10.2” 列 出 Unix 域 套 接 字 
你 可 以 使 用 1sof -U 来 查看 系统 正在 使 用 中 的 Unix 域 套 接 字 : 


# lsof -U 

COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME 

mysqld 19701 mysql 12u unix Oxe4defcco Oot0 35201227 /var/run/mysqld/mysqld.sock 
chromium- 26534 juser 5u Unix Oxeeac9b00 Oot0 42445141 socket 

tlsmgr 30480 postfix 5uU unix Oxc3384240 Oot0 17009106 socket 

tlsmgr 30480 postfix 6u unix Oxe20161c0 oto 10965 private/tlsmgr 

-- snip-- 


因为 很 多 现代 的 应 用 都 用 到 了 非 命名 套 接 字 ,所 以 这 个 列表 可 能 会 很 长 .你 可 以 借助 “socket” 
来 识别 那些 非 命 名 套 接 字 ( 如 NAME 列 所 见 )。 
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shell 脚 本 


如 果 你 可 以 在 shell 中 输入 命令 ， 那么 你 就 可 以 使 用 shell 
脚本 ( 或 者 叫 Bourne shell 脚 本 )。 所 谓 shell 脚 本 ， 就 是 将 一 
系列 命令 写 在 一 个 文件 当中 ， 然 后 让 shell 从 该 文件 读 取 命 
令 ， 就 像 从 终端 读 取 一 样 。 


11.1 ” shell 脚本 基础 


Bourne shell 脚 本 一 般 以 如 下 所 示 的 行 开头 ， 它 表示 我 们 要 用 /bin/sh 程 序 来 执行 脚本 文件 中 
的 命令 。( 请 确认 脚本 文件 开头 没有 空格 。) 


#!/bin/sh 


其 中 的 #1 叫 作 shebang， 你 在 本 书 的 其 他 脚本 例子 中 也 会 看 到 这 一 行 。 你 可 以 在 该 行 之 后 列 
出 任何 你 想 让 shell 帮 你 执行 的 命令 。 例 如 : 


#!1/bin/sh 
# 
# Print something, then run ls 


echo About to run the ls command. 
ls 


注解 ”车 行 以 字符 # 开 头 ， 则 表示 该 行为 注释 ， 即 shell 会 忽略 一 行 中 # 之 后 的 所 有 东西 。 注 释 可 
用 于 解释 脚本 中 难 懂 的 部 分 。 


创建 好 shell 脚 本 并 设置 好 它 的 权限 之 后 ， 你 就 可 以 将 该 脚本 放 到 你 命令 路 径 的 某 个 目录 中 ， 
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然后 在 命令 行 里 输入 脚本 文件 的 名 字 来 运行 它 。 如 果 它 在 你 当前 目录 下 ,你 还 可 以 用 ./script 来 
运行 它 。 当 然 也 可 以 输入 它 完整 的 路 径 名 来 运行 。 

就 像 Unix 系 统 的 其 他 程序 一 样 ， 你 需要 给 shell 脚 本 文件 设置 执行 位 和 读 位 〈 以 让 shell 能 读 取 
该 文件 )。 最 简单 的 设置 方法 是 像 下 面 这 样 : 


$ chmod +rx script 


如 此 执行 chmod， 就 会 使 其 他 用 户 都 能 查看 和 执行 script。 如 果 你 不 希望 这 样 ， 可 转 用 绝对 
模式 700 ( 请 参考 2.17 节 来 温习 一 下 权限 )。 
基于 这 些 基 础 知识 ， 现 在 来 看 看 shell 脚 本 的 局 限 性 。 


shell 脚 本 的 局 限 性 


使 用 Bourne shell 能 方便 地 操控 命令 和 文件 。 在 2.14 节 中 ， 我 们 看 到 了 shell 能 重 定向 输出 ， 这 
是 shell 脚 本 编程 的 重要 元 素 之 一 。 然 而 ，shell 脚 本 只 是 Unix 编 程 的 一 个 辅助 工具 ， 虽 然 它 相当 有 
用 , 但 也 有 一 些 局 限 性 。 

shell 脚 本 的 主要 优点 是 ， 它 能 使 任务 简单 化 、 自 动 化 ， 而 不 用 你 在 命令 行 提 示 符 下 一 条 条 地 
敲 命 令 ( 这 对 批量 处 理 文件 很 方便 )。 但 如 果 你 要 分 解 字符 串 、 做 繁复 的 数学 计算 、 做 复杂 的 数 
据 库 交 互 ， 或 者 你 想 写 函数 以 及 复杂 的 控制 结构 ， 你 最 好 还 是 用 Python 、Perl 之 类 的 脚本 语言 ， 
或 者 awk， 甚 至 C 这 样 的 编译 型 语言 。( 这 是 很 重要 的 ， 所 以 本 章 将 会 多 次 提 到 这 点 )。 

最 后 ,注意 你 shell 脚 本 的 大 小 ， 尽 量 写 得 短小 一 些 。Bourne shell 脚 本 不 应 该 写 太 大 (虽然 有 
人 还 是 会 写 很 大 )。 


11.2 引号 与 字面 量 


shell 和 shell 脚 本 最 令 人 困惑 的 一 点 就 是 , 何 时 需要 使 用 引号 和 其 他 标点 符号 ， 且 为 什么 这 么 
做 。 假 设 你 想 打 印 出 字符 串 $100， 于 是 你 这 么 做 : 


$ echo $100 
00 


为 什么 会 打出 00 呢 ”因为 shell 看 到 了 $1， 它 是 一 个 shell 变 量 ( 这 很 快 会 讲 到 )。 于 是 你 可 能 
会 想 给 它 加 上 双 引 号 ， 让 shell 不 管 $1。 但 这 样 也 不 行 : 


$ echo "$100" 
00 


然后 有 人 告诉 你 ， 要 用 单 引号 : 


$ echo '$100" 
$100 
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为 什么 这 样 就 行 呢 ? 
11.2.1 字面 量 


引号 通常 用 于 创建 字面 量 ， 即 原封 不 动 的 字面 义 。 就 像 上 例 中 ， 用 引号 直接 打出 $ ， 又 例如 
你 想 把 * 传 给 grep 之 类 的 命令 ， 或 在 命令 中 用 分 号 〈; ) 作为 参数 ， 都 可 以 用 单 引号 。 

操作 脚本 或 命令 行 时 ， 先 想 想 shell 是 如 何 执行 一 条 命令 的 。 

(1) 在 执行 之 前 ，shell 会 查找 其 中 的 变量 、 通 配 符 以 及 其 他 代词 ， 如 果 有 的 话 ， 就 将 它们 进 
行 蔡 代 。 

(2) 将 替换 后 的 结果 返回 给 命令 。 

涉及 字面 量 的 问题 是 很 微妙 的 。 假 设 你 想 查 找 /etc/passwd 中 符合 正则 表达 式 r.*t ( 意思 是 含 
有 先 r 后 t 的 行 ， 例 如 含有 用 户 名 root 、ruth 或 robot 的 行 ) 的 所 有 条 目 ， 你 可 以 执行 这 样 的 命令 : 


$ grep r.*t /etc/passwd 


大 多 数 时 候 这 样 是 行 得 通 的 , 但 有 时 却 神秘 地 失效 了 。 为 什么 呢 ? 问题 可 能 在 于 你 当前 的 目 
录 。 如 果 当 前 目录 包含 名 字 如 r.input 和 r.output 的 文件 ， 那 么 shell 就 会 将 r.*t 扩 展 为 r.input 和 


r.output ， 命 令 就 会 变 成 


$ grep r.input T.output /etc/passwd 


避免 这 种 问题 的 关键 是 ， 找 出 可 能 被 扩展 的 字符 ， 然 后 用 正确 的 引号 来 保护 它 。 


11.2.2 单 引 号 
创建 字面 量 的 最 简单 的 方法 就 是 用 单 引 号 将 字符 串 包 围 , 就 像 以 下 在 grep 命 令 中 用 * 的 字面 量 : 


$ grep 'r.*t' /etc/passwd 


对 于 shell 来 说 ， 单 引号 之 间 的 字符 ( 包括 空格 )， 都 会 被 当 作 一 个 单独 的 参数 。 所 以 ， 以 下 
命令 是 行 不 通 的 ， 因 为 这 样 参数 就 只 有 一 个 了 ， 它 会 让 grep 在 标准 输入 中 查找 字符 串 r.*t 
/etc/passwd。 


$ grep 'r.*t /etc/passwd' 


当 你 想 使 用 字面 量 时 ， 请 优先 考虑 单 引 号 ， 它 保证 shell 不 会 做 任何 替换 ， 因 此 语法 上 也 十 分 
整洁 。 然 而 ， 可 能 有 时 你 的 需求 会 有 点 复杂 ， 那么 再 考虑 双 引 号 。 


11.2.3 双 引 号 
双 引 号 (" ) 跟 单 引号 的 效果 差不多 ， 只 是 shell 会 对 双 引 号 中 的 所 有 变量 都 进行 扩展 。 你 可 
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以 试 试 以 下 命令 ， 然 后 换 成 单 引 号 再 试 试 。 


$ echo "There is no * in my path: $PATH" 


以 上 命令 中 的 $pPATH 会 被 转换 ， 但 * 却 没 奸 


二 
oO 


注解 ”如 果 你 使 用 双 引 号 来 打印 大 段 文本 ， 可 考虑 使 用 将 在 11.9 节 讲 的 here 文 档 。 


11.2.4 单 引 号 的 字面 义 


若 想 在 Bourne shell 中 使 用 单 引 号 的 字面 义 , 那 就 有 点 棘手 了 。 有 种 解决 方法 是 在 单 引号 前 加 
个 反 斜 杠 : 


$ echo I don\'t like contractions inside shell scripts. 


该 反 斜 杜 和 单 引 号 绝 不 能 被 任何 单 引号 对 包围 ， 而 ' don\'t 这 样 的 语法 也 是 错 的 。 稀奇 的 是 ， 
双 引 号 里 可 以 用 单 引号 ， 就 像 下 面 的 例子 (效果 跟 上 面 例子 一 样 ): 


$ echo "I don't like contractions inside shell scripts." 


如 果 你 想 知道 “不 做 转换 ”的 一 般 法 则 ， 可 参照 以 下 做 法 : 

(1) 将 所 有 ' ( 单 引 号 ) 改 成 \"( 单 引号 、 反 斜 杠 、 单 引号 、 单 引号 ); 

(2) 用 单 引 号 包围 整个 字符 串 。 

因此 ， 对 于 this isn't a forward slash: \ 这 种 麻烦 的 东西 ， 可 以 这 样 做 : 


$ echo 'this isn'\''t a forward slash: \' 


注解 反复 提醒 自己 : 引号 中 的 任何 东西 都 会 被 当成 一 个 参数 。 所 以 ，ab c 是 三 个 参数 ， 而 a "b 
c" 则 是 两 个 。 


11.3 ”特殊 变量 


大 多 数 shell 脚 本 都 能 够 理解 命令 行 的 参数 ， 以 及 懂得 执行 脚本 里 的 命令 。 想 要 让 脚本 变 成 一 
个 灵活 的 程序 而 不 仅仅 是 一 个 命令 列表 ， 你 需要 知道 特别 变量 的 用 法 。 这 些 特 别 变量 跟 2.8 节 介 
绍 的 变量 很 像 ， 只 是 你 不 能 直接 改变 它们 的 值 。 


注解 ” 读 完 下 面 几 节 ， 你 就 会 知道 为 什么 shell 脚 本 会 有 这 么 多 特别 的 字符 。 如 果 你 在 脚本 中 遇 
到 很 难 理解 的 语句 ， 试 试 将 其 分 拆 。 
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11.3.1 单个 参数 : $1，$2，…… 
像 $1 、$2 等 所 有 以 正 整数 命名 的 变量 , 都 包含 了 脚本 的 参数 值 。 例如 , 现 有 一 脚本 名 叫 pshow: 
#!/bin/sh 


echo First argument: $1 
echo Third argument: $3 


执行 下 列 脚本 ， 看 它 怎样 打印 参数 : 


$ ./pshow one two three 
First argument: one 
Third argument: three 


shell 的 内 置 命令 shift 能 删除 第 一 个 参数 $1， 并 用 后 面 的 补 上 。 说 具体 一 点 ， 就 是 $2 变 成 $1， 
$3 变 成 $2， 如 此 类 推 。 例 如 ， 现 有 一 脚本 名 称 叫 shiftex: 


#!/bin/sh 

echo Argument: $1 
shift 

echo Argument: $1 
shift 

echo Argument: $1 


运行 来 看 看 它 是 怎样 运作 的 : 


$ ./shiftex one two three 
Argument: one 

Argument: two 

Argument: three 


如 你 所 见 ，shiftex 每 次 只 打印 第 一 个 参数 , 但 因 重 复 地 使 用 shift, 所 以 全 部 参数 都 打出 来 了 。 
11.3.2 ”参数 的 数量 : 竺 


钳 变 量 持 有 传 给 脚本 的 变量 的 数量 ， 这 对 循环 使 用 shift 来 遍历 参数 很 有 帮助 。 当 岩 为 0 时 ， 
就 代表 没有 参数 了 ， 所 以 $1 会 是 空 。( 参考 11.6 节 与 循环 相关 的 知识 。) 


11.3.3 所 有 参数: $@ 


$@ 变 量 代表 脚本 接收 的 所 有 参数 ， 可 以 整个 传 给 脚本 内 的 某 个 命令 。 例 如 ，Ghostscript 命 令 
(gs ) 通常 又 长 又 复杂 。 假 设 你 想 以 150dpi 来 栅 格 化 一 个 PostScript 文 件 ， 并 用 标准 输出 打印 ， 同 
时 又 想 为 别人 传 其 他 选项 预 留 一 些 可 能 性 ， 你 就 可 以 这 样 写 脚本 ， 以 允许 额外 的 命令 行 选 项 : 


#!/bin/sh 
gs -q -dBATCH -dNOPAUSE -dSAFER -sOutputFile=- -sDEVICE=pnmraw $@ 
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注解 ”如 果 脚 本 中 有 一 行 的 长 度 超 出 了 文本 编辑 器 的 范围 ， 你 可 以 用 反 斜 杠 (\ ) 来 分 割 它 。 例 
如 ， 可 将 上 面 的 例子 改 为 : 


#!1/bin/sh 
gs -q -dBATCH -dNOPAUSE -dSAFER \ 
-SOutputFile=- -sDEVICE=pnmraw $@ 


11.3.4 脚本 名 : $0 


$0 持 有 脚本 的 名 称 ， 这 对 生成 诊断 信息 很 有 帮助 。 例 如 ， 如 果 你 希望 脚本 能 报告 $BADPARM 变 
量 出 现 非法 值 的 情况 ， 你 就 可 以 这 样 写 ， 使 得 脚本 名 包含 在 报错 信息 中 : 


echo $0: bad option $BADPARM 


所 有 的 报错 信息 都 应 该 转 到 标准 错误 。 回 忆 2.14.1 节 讲 的 标准 错误 ， 其 中 提 到 的 2>81 能 让 标准 
错误 重 定向 到 标准 输出 。 若 想 反 转 这 一 过 程 , 将 上 例 的 标准 输出 重 定向 到 标准 错误 , 可 以 使 用 1>82: 


echo $0: bad option $BADPARM 1>&2 


11.3.5 ”进程 号 : 和 
$$ 变量 持 有 shell 的 进程 号 。 
11.3.6 ”退出 码 : $? 
$? 变 量 持 有 shell 执 行 的 最 后 一 条 命令 的 退出 码 。 它 对 掌控 shell 脚 本 来 说 非常 重要 ， 接 下 来 就 
会 讲 到 。 
11.4 ”退出 码 


Unix 程 序 退 出 时 , 会 留 一 个 退出 码 给 启动 该 程序 的 父 进程 。 它 是 一 个 数字 ,有 时 也 叫 错误 码 
或 退出 值 。 当 退出 码 是 Oo 时， 通常 表示 程序 运行 正常 。 而 如 果 是 非 正常 结束 ， 那么 退出 码 通 常会 
是 非 零 数 ( 也 不 总 是 这 样 ， 下 面 会 说 到 )。 

因为 $? 这 一 特殊 变量 含有 最 后 一 条 命令 的 退出 码 ， 所 以 你 可 以 通过 shell 提 示 符 来 查看 它 。 


$ 1s / > /dev/null 

$ echo $? 

0 

$ 1s /asdfasdf > /dev/null 

ls: /asdfasdf: No such file or directory 
$ echo $? 

1 
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从 上 例 可 以 看 到 ,成 功 的 命令 返回 0, 失 败 的 命令 返回 1 当然 ,我 们 假设 你 系统 中 没有 /asdfasdf 
这 样 的 目录 )。 

如 果 你 要 用 某 条 命令 的 退出 码 , 那 就 必须 在 执行 完 该 命令 后 就 马上 用 ,不 然 就 要 先 保存 起 来 。 
例如 ， 你 连续 运行 了 两 次 echo $? ， 那 么 第 二 条 的 结果 肯定 总 是 为 0， 因 为 第 一 个 echo 总 是 成 功 。 

当 需 要 让 脚本 非 正 常 退出 时 ， 可 使 用 exit 1， 指 定 退 出 码 1， 并 传 给 父 进程 。( 你 可 以 为 不 同 
情况 最 使 用 不 同 的 退出 码 。) 

要 注意 的 是 ， 有 些 程序 ， 如 diff 和 grep， 正 常 退 出 时 也 会 使 用 非 零 的 退出 码 。 例 如 ，grep 会 
在 匹配 时 返回 0， 不 匹配 时 返回 1。 对 于 这 些 程序 来 说 ， 退 出 码 1 不 代表 出 错 ; grep 和 diff 使 用 2 来 
代表 出 错 。 如 果 你 不 确定 某 个 程序 是 否 用 非 零 退 出 码 来 指 代 运 行 成 功 ， 可 参考 其 帮助 手册 , 通常 
在 EXIT VALUE 或 DIAGNOSTICS 节 中 能 找到 解释 。 


11.5 条件 判断 


针对 条 件 判断 , Bourne shell 有 一 种 特别 的 代码 结构 , 如 if/then/ else 和 case 语 句 。 举 个 例子 ， 
以 下 带 有 if 条 件 判 断 的 脚本 会 检查 第 一 个 参数 是 否 为 hi: 


#!1/bin/sh 

if [ $1 = hi ]; then 
echo 'The first argument Was “hi” 

else 
echo -n 'The first argument was not "hi"” --" 
echo It was '"'$1'"" 

fi 


以 上 脚本 的 if、then、else 和 人 是 shell 关 键 字 ， 其 余 都 是 命令 。 这 样 区 分 是 很 重要 的 ， 如 [ $1 
= "hi" ] 就 是 一 条 命令 , 其 中 [字符 是 Unix 系 统 中 的 一 个 实际 存在 的 程序 , 而 不 是 shell 的 语法 。( 其 
实 这 种 说 法 不 完全 准确 ， 很 快 你 就 会 看 到 。 但 暂时 先 把 它 当 作 命令 。) 所 有 Unix 系 统 都 有 一 个 命 
令 叫 [， 它 能 进行 条 件 测试 。 这 个 程序 还 有 另外 一 个 名 字 ， 叫 test。 对 比 [ 和 test， 会 发 现 它 们 指 
向 同一 个 inode， 或 者 其 中 一 个 是 另 一 个 的 符号 链接 。 
理解 了 11.4 节 讲 的 退出 码 ， 才 能 看 懂 上 例 脚 本 的 运作 : 
(1) shell 执 行 放 关键 字 之 后 的 命令 ， 获 取 了 其 退出 码 ; 
(2) 如 果 退 出 码 是 0o，shell 就 会 接着 执行 then 关 键 字 后 的 命令 ， 直 至 遇 到 else 或 fi 关键 字 ; 
(3) 如 果 退 出 码 为 非 0， 并 且 有 else， 就 会 执行 else 后 的 命令 ; 
(4) 条 件 判断 止 于 fi。 


11.5.1 防范 空 参数 


上 例 的 条 件 判断 还 有 个 小 问题 ， 即 $1 可 能 会 是 空 的 ， 因 为 用 户 可 能 没有 输入 参数 。 没 有 参数 
的 话 ， 该 脚本 就 会 变 成 [ = hi ]， 令 [出 错 并 中 止 。 你 可 用 以 下 其 中 一 种 方法 〈 两 种 都 很 常见 ) 
来 修复 : 
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shell 脚本 


if [ "$1" = hi ]; then 
if [ x"$1" = x"hi" ]; then 


11.5.2 ”使 用 其 他 命令 来 测试 


if 之 后 的 内 容 必须 是 命令 。 因 此 ， 如 果 想 将 then 放 在 同一 行 ， 必 须 在 test 命 令 后 加 上 分 
号 (; )。 如 果 没 有 分 号 ，test 命 令 会 将 then 当 成 是 参数 。( 如 果 你 不 喜 用 分 号 ， 可 将 then 放 在 


下 一 行 。 ) 
除了 [， 还 是 有 


很 多 其 他 命令 可 用 于 测试 的 。 以 下 就 是 一 个 用 grep 来 测试 的 例子 : 


#!1/bin/sh 


if grep -q daemon /etc/passwd; then 
echo The daemon user is in the passwd file. 


else 

echo There is a big problem. daemon is not in the passwd file. 
fi 
11.5.3 elif 


if 后 面 还 可 以 用 elif 关 键 字 ,如 下 所 示 。 但 别 串 接 太 多 的 elif， 因 为 你 会 发 现 后 面 11.5.6 节 的 
case 更 适合 多 条 件 分 支 的 情况 。 


#!1/bin/sh 


if [ "$1" = "hi" ]; then 

echo 'The first argument Was "hi"' 
elif [ "$2" = "bye" ]; then 

echo 'The second argument was “bye”' 


else 


echo -n 'The first argument Was not "hi" and the second was not "bye"-- 


echo They were 
fi 


$1 and $2" 


11.5.4 ”逻辑 结构 88 和 || 
你 会 经 常 看 到 这 两 种 单行 的 条 件 判断 结构 ，8& (“和 ”) 和 || (“或 ”)，8&8 结 构 是 这 样 用 的 : 


command1 && command2 


这 里 ，shell 会 执行 command1， 如 果 其 退出 码 是 0， 就 会 接着 执行 command2。| | 结构 也 类 似 。 如 
果 || 之 前 的 命令 返回 了 非 0 的 退出 码 ，| | 之 后 的 命令 就 会 被 执行 。 

放 测 试 中 也 常常 用 到 8 和 ||。 无 论 是 用 哪 一 个 ， 都 是 由 最 后 执行 的 命令 的 退出 码 来 决定 条 件 
判断 的 走向 。 在 的 情况 中 ， 如 果 第 一 条 命令 失败 了 ，shell 就 会 用 到 if 语 句 的 退出 码 , 但 如 果 它 
成 功 了 ， 则 会 用 第 二 条 命令 的 退出 码 。 在 | | 的 情况 中 ， 如果 第 一 条 命令 成 功 了 ， if 就 会 用 到 它 的 
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退出 码 , 但 如 果 它 失败 了 ， 则 会 用 第 二 条 命令 的 退出 码 。 
例如 : 


#!/bin/sh 

if [ "$1" a hi ] || [ "$1" bye ]; then 
echo 'The first argument was "'$1'"" 

fi 


如 果 你 的 条 件 判 断 包 含 了 test ([ ) 命令 ， 如 上 例 所 示 , 那么 你 可 以 不 用 8 和 || ， 而 用 -a 和 -o， 
这 个 下 节 会 讲 到 。 
11.5.5 测试 条 件 


你 已 经 见识 过 [的 运作 方式 :测试 成 功 返 回 0 ,测试 失败 返回 1。 你 也 知道 了 可 以 用 [ str1 = str2 ] 
来 判断 字符 串 是 否 相 同 。 然 而 你 还 要 知道 ，[ 这 个 有 用 的 测试 牵扯 到 文件 的 属性 ， 使 得 shell 脚 本 


很 适合 处 理 文件 。 例 如 ， 以 下 代码 就 测试 了 一 个 文件 是 否 为 普通 文件 ( 非 目录 或 特殊 文件 ): 
[ -f fz7e ] 


你 可 能 会 看 到 有 脚本 将 -f 测 试 置 于 循环 之 中 , 像 下 面 所 示 , 用 来 测试 当前 目录 里 的 所 有 项 目 
(关于 循环 ， 后 面 很 快 就 会 讲 到 ): 


for filename in *; do 
if [ -f $filename ]; then 
ls -1 $filename 
file $filename 
else 
echo $filename is not a regular file. 
fi 
done 


你 可 在 参数 前 加 运算 符 ! 来 测试 相反 的 情况 。 例 如 ，[ ! -f file ] 会 在 file 不 是 普通 文件 的 情 
况 下 返回 true。 此 外 ，-a 和 -o 对 应 “and” 和 和 “or” 运算 符 (例如 [ -f file1 -a file2 ] )。 


注解 ”因为 test 命 令 在 脚本 中 应 用 广泛 ， 所 以 很 多 Bourne shell 版 本 ( 包括 bash ) 都 内 置 了 test， 
这 使 得 shell 不 需要 为 每 个 测试 都 单独 执行 一 次 命令 ， 从 而 加 快 了 速度 。 


test 运 算 符 有 一 大 堆 ， 它 们 可 分 为 三 类 : 文件 测试 、 字 符 串 测试 和 算术 测试 。info 手 册 有 完 
整 的 在 线 文档 , 但 参考 test() 帮 助手 册 更 方便 快捷 。 以 下 小 节 概 述 了 主要 的 测试 运算 符 。( 已 将 不 
常用 的 忽略 。) 

文件 测试 

大 多 数 文件 运算 符 ， 像 -f， 被 称 为 一 元 运算 符 ， 因 为 他 们 只 要 求 一 个 参数 : 被 测试 的 文件 。 
例如 下 面 这 两 个 重要 的 运算 符 : 
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口 -e: 文件 存在 时 返回 true; 
口 -s: 文件 非 空 时 返回 true。 

有 些 运算 符 能 检查 文件 的 类 型 ,这 意味 着 他 们 能 看 出 一 个 东西 是 普通 文件 、 目 录 , 还 是 某 种 
特殊 设备 ( 如 表 11-1 )。 另 外 ， 也 有 一 些 一 元 运算 符 是 检查 文件 权限 的 ， 如 表 11-2。( 关于 文件 权 
限 ， 详 见 2.17 节 。) 


表 11-1 文件 类 型 运算 符 


运算 符 用 于 测试 
普通 文件 
目录 
抽 符号 链接 
b 块 设备 
字符 设备 
命名 管道 
-5 套 接 字 


注解 ”test 命 令 会 直达 符号 链接 所 指 的 文件 (除非 用 -h 测 试 ) 意思 是 ， 如 果 ]link 是 某 个 普通 文 
件 的 符号 链接 ， 则 [ -f link ] 返 回 true (退出 码 为 0 )。 


表 11-2 文件 权限 运算 符 


运算 符 用 于 测试 
-I 可 读 
可 写 
人 可 执行 
型 Setuid 
8 Setgid 
< “Sticky” 


最 后 ,还 有 三 个 二 元 运算 符 (需要 两 个 文件 作为 参数 ) 是 用 于 文件 测试 的 , 但 不 常用 。 看 看 
以 下 包含 -nt ( 意思 是 “新 于 ”) 的 命令 : 


[ filerz -nt file2 ] 


如 果 file1 的 修改 时 间 比 file2 要 新 ， 命 令 就 返回 true。 而 -ot (意思 是 “ 旧 于 ”) 则 相反 。 想 
检测 一 个 文件 是 否 是 男 一 文件 的 硬 链 接 ， 可 用 -ef。 

字符 串 测试 

之 前 讲 过 ， 当 两 字符 串 相 同时 ， 二 元 字符 串 运算 符 = 会 返回 true。 而 != 是 在 两 字符 串 不 相同 
时 返回 true。 一 元 的 字符 串 运 算 符 有 两 个 : 

口 -z: 参数 为 空 时 返回 true([ -z""] 返 回 0); 
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口 -n: 参数 为 非 空 时 返回 true ([ -n " "”] 返 回 1 )。 
算术 测试 
你 需要 认识 到 ， 等 号 (=) 是 用 于 检验 字符 串 相等 性 的 ， 而 不 是 数字 。 因 此 ，[ 1 = 1 ] 返 回 
0 ( true ), 但 [ 01 =1] 返 回 false。 当 你 想 要 检验 两 个 数字 是 否 相 等 时 ， 请 用 -eq， 而 非 等 号 : [ 01 
-eq 1 ] 会 返回 true。 表 11-3 展 示 了 所 有 比较 数字 的 运算 符 。 
表 11-3 ”比较 数字 的 运算 符 


运算 符 当 参 数 一 与 参数 二 相 比 ，…… 上 时， 返回 true 
-eq 相等 
-me 不 等 
-1t 更 小 
-gt 更 大 
-le 更 小 或 相等 
-ge 更 大 或 相等 


11.5.6 ”用 case 进 行 字符 串 匹 配 


关键 字 case 用 于 男 一 种 条 件 判断 结构 ， 在 进行 字符 串 匹 配 时 ， 它 格外 好 用 。case 条 件 判断 不 
执行 任何 test 命 令 ， 因 此 没有 退出 码 。 它 是 做 模式 匹配 的 ， 以 下 例子 大 概 说 明了 它 的 情况 。 


#!/bin/sh 
case $1 in 
bye) 
echo Fine, bye. 


hi|hello) 
echo Nice to see you. 


33 
what*) 
echo Whatever. 
33 
*) 
echo 'Huh?" 
;3 
esac 


其 运行 过 程 如 下 : 

(1) 脚本 将 $1 与 每 个 ) 字 符 前 的 案例 进行 对 比 ; 

(2) 如 果 匹 配 ， 就 会 执行 该 案例 后 的 命令 ， 直 至 遇 到 ;; 时 ， 跳 到 esac 关 键 字 ; 

(3) 整个 条 件 判 断 结果 以 esac 关 键 字 结 束 。 

案例 可 以 是 单个 字符 串 〈 如 上 例 的 bye ) 或 者 是 用 | 分 隔 的 多 个 字符 串 〈 如 果 $1 是 hi 或 hello， 
则 hi|hello 返 回 true ), 你 也 可 以 使 用 * 或 ?模式 ( 如 what* )。 若 想 定 义 一 个 特定 案例 以 外 的 默认 案 
例 ， 可 用 *， 如 上 面 代码 的 最 后 一 个 案例 。 
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注解 ”每 个 案例 都 应 以 双 分 号 ( ;; ) 结束， 否则 可 能 会 导致 语法 错误 。 


11.6 ”循环 
Bourne shell 中 有 两 种 循环 : for 和 while。 


11.6.1 for 循环 


for 循 环 ( 其 实 是 “for each” 循 环 ) 是 最 常见 的 ， 如 下 所 示 : 


#!/bin/sh 

for str in one two three four; do 
echo $str 

done 


以 上 的 for、in、do 和 done 都 是 shell 关 键 字 。 它 的 运行 过 程 是 这 样 的 : 

(1) 将 关键 字 in 后 的 四 个 以 空格 区 分 的 值 赋值 到 变量 str ( 使 其 为 one ); 

(2) 执行 do 和 done 之 间 的 echo 命 令 ; 

(3) 回 到 for 那 一 行 ， 把 下 一 个 值 ( two ) 赋予 strz， 执 行 do 和 done 之 间 的 echo 命 令 …… 这 样 重 
复 着 直至 关键 字 in 后 的 值 都 经 历 过 。 

此 脚本 的 输出 如 下 : 


one 
two 
three 
four 


11.6.2 while 循环 
Bourne shell 的 while 循 环 会 使 用 到 退出 码 ， 就 像 if 一 样 。 例 如 ， 以 下 脚本 例子 做 了 10 次 迭代 。 


#!1/bin/sh 
FILE=/tmp/whiletest. $$; 
echo firstline > $FILE 
while tail -10 $FILE | grep -q firstline; do 
# add lines to $FILE until tail -10 $FILE no longer prints "firstline" 
echo -n Number of lines in $FILE:" ' 
wc -1 $FILE | awk '{print $1} 
echo newline >> $FILE 
done 


rm -f $FILE 
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a 

2 

| 
b= 


以 上 代码 会 进行 grep -q firstline 的 测试 。 只 要 该 测试 的 退出 码 非 零 (本 例 中 ， 若 $FILE 的 
最 后 10 行 不 包含 字符 串 firstline， 则 非 零 )， 循 环 就 会 结束 。 

你 可 以 用 break 语 句 来 打 断 while 循 环 。Bourne shell 还 有 一 种 类 似 while 循 环 的 until 和 循环， 它 
在 退出 码 为 零 ， 而 不 是 非 零 时 结束 循环 。 但 是 ， 你 不 应 该 经 常 使 用 while 或 until。 实 际 上 ， 你 应 
该 用 awk 或 Python 来 代替 while。 


11.7 ”命令 替换 


Bourne shell 能 够 做 到 将 一 个 命令 的 标准 输出 重 定向 回 该 shell 的 命令 行 。 意思 是 , 你 可 以 将 一 个 
命令 的 输出 作为 男 一 个 命令 的 参数 ， 或 者 用 $() 将 命令 包围 ， 使 该 命令 的 输出 能 被 当 作 变量 使 用 。 

以 下 例子 就 把 一 个 命令 的 输出 保存 在 了 名 为 FLAGS 的 变量 中 。 代 码 第 二 行 的 粗 体 部 分 展示 了 
这 种 命令 蔡 换 。 


#!/bin/sh 
FLAGS=$(grep ^flags /proc/cpuinfo | sed 's/.*://' | head -1) 
echo Your processor supports: 
for f in $FLAGS; do 
case $f in 
fpu) MSG="floating point unit" 


233 
3dnow) MSG="3DNOW graphics extensions" 
33 
mtrr) MSG="memory type range register" 
33 
*) MSG="unknown" 
33 
esac 
echo $f: $MSG 
done 


本 例 说 明 ， 你 可 以 在 命令 替换 中 使 用 单 引 号 和 管道 ， 看 起 来 有 点 复杂 。 其 中 ，grep 命 令 的 结 
果 被 发 送 到 sed 命 令 ( 详 见 11.10.3 节 )。 该 sed 命 令 会 将 匹配 .*: 的 内 容 都 清空 掉 ， 然 后 得 到 的 结果 
再 发 送 给 head 命 令 。 

注意 不 要 过 度 使 用 命令 替换 。 例 如 ， 请 不 要 在 脚本 中 用 $(1s) ， 而 是 改 用 shell 展 开 * ， 因 为 这 
样 更 快速 。 同 样 ， 如 果 你 想 将 find 命 令 查 到 的 文件 用 作 另 一 个 命令 的 参数 ， 请 不 要 用 命令 蔡 换 ， 
而 考虑 用 管道 将 结果 发 到 xargs， 或 者 使 用 find 的 -exec 选 项 〈( 详 见 11.10.4 节 )。 


注解 ”命令 替换 的 传统 做 法 是 使 用 反 引 号 (、) 包围 命令 ， 你 会 在 很 多 shell 脚 本 中 看 到 。$0 语 法 
是 一 种 较 新 的 形式 ， 但 它 符 合 POSIX 标 准 ， 所 以 更 容易 阅读 和 编写 。 
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11.8 ”管理 临时 文件 


有 时 我 们 需要 用 临时 文件 把 输出 暂 存 起 来 , 以 供 后 续 的 命令 使 用 。 请 确保 临时 文件 的 文件 名 
足够 特别 ， 以 免 被 其 他 程序 误 认 并 误 写 入 数据 。 

以 下 展示 了 如 何 使 用 mktemp 命 令 来 创建 临时 文件 名 。 该 脚本 能 显示 出 过 往 两 秒 内 的 设备 中 断 
信息 : 


#!/bin/sh 
TMPFILE1=$(mktemp /tmp/im1 .XXXXXX) 
TMPFILE2=$(mktemp /tmp/im2.XXXXXX) 


cat /proc/interrupts > $TMPFILE1 
sleep 2 

cat /proc/interrupts > $TMPFILE2 
diff $TMPFILE1 $TMPFILE2 

rm -f $TMPFILE1 $TMPFILE2 


给 予 mktemp 的 参数 是 一 个 模板 。mktemp 会 将 XXXXXX 转 换 成 一 个 唯一 的 字符 串 ， 并 以 该 名 字 创 
建 出 一 个 空 文件 。 注意, 该 脚本 将 文件 名 保存 在 变量 中 , 所 以 改 文件 名 的 话 就 只 需要 改 一 行 而 已 。 


注解 并 非 所 有 版 本 的 类 Unix 系 统 都 带 有 mktemp 。 如 果 移植 代码 后 出 现 问 题 ， 最 好 先 安装 一 下 
GNU coreutils 包 。 


临时 文件 还 有 一 个 问题 ， 就 是 如 果 脚 本 中 止 了 ,临时 文件 就 可 能 不 会 被 删 掉 。 上 例 中 ,如 果 在 
第 二 个 cat 之 前 按 下 CTRL-C 的 话 ， 就 会 使 得 临时 文件 留 在 mp 里 。 请 尽 可 能 防止 这 种 事情 的 发 生 。 
你 可 以 用 trap 命 令 来 创建 一 个 信号 处 理 器 ， 在 捕获 到 CTRL-C 的 信号 时 ， 删 除 临时 文件 ， 如 下 所 示 : 


#!/bin/sh 

TMPFILE1=$(mktemp /tmp/im1 .XXXXXX) 
TMPFILE2=$(mktemp /tmp/im2.XXXXXX) 

trap "rm -f $TMPFILE1 $TMPFILE2; exit 1" INT 
-- Snip-- 


你 必须 在 该 处 理 器 中 显 式 地 使 用 exit 来 退出 脚本 , 否则 在 trap 过 后 , 脚本 仍 会 继续 往 下 执行 。 


注解 mktemp 不 一 定 要 有 参数 。 无 参数 的 时 候 ， 模 板 会 以 /tmp/tmp. 前 组 开头。 


11.9” here 文档 


假设 你 想 打 印 大 有 段 文字 ,或 将 大 段 文字 传 给 另 一 个 命令 , 与 其 用 一 大 堆 echo 命 令 , 不 如 用 shell 
的 here 文 档 。 如 下 例 所 示 : 
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#!/bin/sh 
DATE=$ (date) 
cat <<EOF 
Date: $DATE 


The output above is from the Unix date command. 
It's not a very interesting command. 
EOF 


上 例 的 粗 体 部 分 ( 即 <xEO0F ) 就 控制 着 here 文 档 。shell 会 把 cxE0F 之 后 的 标准 输入 都 重 定向 到 
<<EOF 之 前 的 命令 (本 例 中 的 cat )。 重 定向 截止 于 EOF 再 次 单独 出 现 之 时 。 你 也 可 以 指定 EOF 之 外 的 
标志 ， 但 要 记 住 ， 起 始 标志 与 结束 标志 必须 一 样 。 此 外 ， 一 般 约定 标志 是 用 大 写 的 。 

注意 here 文 档 中 的 $DATE。here 文 档 中 的 shell 变 量 都 会 被 展开 ， 这 在 打印 包含 大 堆 变 量 的 报告 
时 十 分 有 用 。 


11.10 ”重要 的 shell 脚本 工具 


有 一 些 程序 在 shell 脚 本 中 相当 有 用 。 像 basename 之 类 的 工具 ， 是 很 少 单独 使 用 的 ， 所 以 你 可 
能 只 会 在 脚本 中 看 到 它 。 而 awk 之 类 的 工具 ， 则 是 在 命令 行 上 也 常用 到 。 


11.10.1 basename 


想 要 去 掉 文 件 的 扩展 名 ， 或 者 去 掉 路 径 全 名 中 的 目录 部 分 ， 可 以 使 用 basename。 试 试 以 下 命 
令 ， 看 basaname 能 输出 什么 结果 : 


$ basename example.htm] .html 
$ basename /usr/local/bin/example 


以 上 两 条 命令 都 会 返回 example。 其 中 第 一 条 会 将 example.html 中 的 后 级 .html 去 掉 ， 第 二 条 
会 将 全 路 径 中 的 目录 部 分 去 掉 。 
以 下 例子 展示 了 如 何在 脚本 中 使 用 basename 把 GIF 图 像 转 换 成 PNG 格 式 。 


| 


#!1/bin/sh 
for file in *.gif; do 

# exit if there are no files 

if [ ! -f $file ]; then 

exit 

fi 

b=$(basename $file .gif) 

echo Converting $b.gif to $b.png... 

giftopnm $b.gif | pnmtopng > $b.png 
done 
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11.10.2 awk 


awk 的 功能 并 不 单一 ， 实 际 上 它 是 一 种 很 强大 的 编程 语言 。 不 幸 的 是 ， 它 就 像 一 门 失落 的 艺 
术 ， 正 被 更 大 型 的 语言 (如 Python ) 所 取代 。 

关于 awk 的 书 有 很 多 ， 如 Alfred V Aho 、Brian W. Kernighan 和 了 Peter J. Weinberger 的 The AWK 
Programming Language( Addison-Wesley，1988 )。 然 而 ， 很 多 人 都 只 是 用 awk 来 做 一 件 事 一 一 从 
输入 流 中 截取 单一 的 字段 ， 就 像 这 样 : 


$ 1s -1 | awk '{print $5}' 


这 人 句 命令 会 将 1s 的 输出 的 第 五 个 字段 (文件 大 小 ) 打印 出 来 ， 其 结果 就 是 一 列 文件 大 小 。 


11.10.3 sed 


sed ( 意思 是 流 编 辑 器 ) 程序 是 一 个 自动 的 文本 编辑 器 ， 它 能 根据 一 些 表达 式 来 修改 输入 流 
(文件 或 标准 输入 ) 的 内 容 ， 并 将 修改 结果 打印 到 标准 输出 。sed 有 很 多 方面 都 很 像 Unix 原 始 的 文 
本 编辑 器 ed。 它 有 大 量 的 运算 符 .匹配 工具 和 定位 功能 。 跟 awk 一 样 , 讲 sed 的 书 也 有 很 多 , 而 Arnold 
Robbins 的 sedg & awk Pocket Reference, 2nd edition ( O’Reilly，2002 ) 就 是 一 本 涵盖 sed 和 awk 的 快速 
指南 。 
虽然 sed 是 个 很 大 的 程序 ， 本 书 不 能 对 其 深入 分 析 ， 但 讲解 它 的 运作 是 很 简单 的 。 我 们 把 地 
址 和 操作 组 合 起 来 ， 当 作 sed 的 一 个 参数 。 其 中 ， 地 址 是 行 的 集合 ， 而 命令 则 代表 了 我 们 对 这 些 
行 所 要 执行 的 操作 。 

sed 的 常见 用 法 ， 是 根据 一 个 正则 表达 式 ( 详 见 2.5.1 节 ) 进行 内 容 替 换 ， 像 下 面 这 样 : 


$ sed 's/exp/ text/" 


如 果 你 想 将 /etc/passwd 的 第 一 个 冒号 替换 成 6， 可 以 这 么 做 : 


$ sed 's/:/%/' /etc/passwd 


如 果 你 想 将 /etc/passwd 的 所 有 冒号 都 蔡 换 成 %， 可 以 在 末尾 加 上 g 修 饰 符 : 


$ sed 's/:/%/g' /etc/passwd 


以 下 是 按 行 处 理 的 例子 ， 它 读 取 /etc/passwd 的 内 容 ， 并 把 三 到 六 行 去 掉 之 后 ， 打 印 到 标准 


$ sed 3,6d /etc/passwd 


本 例 中 ，3,6 是 地 址 ( 行 的 范围 )， 而 d 是 运算 符 ( delete )。 如 果 没 有 写 地 址 的 话 ，sed 就 会 在 
所 有 行 上 应 用 该 操作 。 最 常用 的 sed 运 算 符 应 该 是 s (查找 与 替换 ) 和 d 了 。 


图 灵 社 区 会 员 小 虎 (164142021@qq.com) 专 享 尊重 版 权 


11.10 重要 的 shell 脚本 工具 219 


你 也 可 以 用 正则 表达 式 作 为 地 址 。 以 下 命令 会 剔除 所 有 匹配 正则 表达 式 exp 的 行 : 


$ sed '/exp/d' 


11.10.4 xargs 


当 你 把 海量 的 文件 当 作 一 个 命令 的 参数 时 , 该 命令 或 者 shell 可 能 会 告诉 你 缓冲 不 足以 容纳 这 
些 参数 。 解 决 这 个 问题 ， 可 用 xargs， 它 能 对 自身 输入 流 的 每 个 文件 名 逐个 地 执行 命令 。 

很 多 人 会 把 xargs 和 find 一 起 用 。 例 如 ， 以 下 脚本 能 帮 你 验证 当前 目录 树 中 所 有 以 .gif 结尾 的 
文件 是 否 真 的 是 GIF 图 像 : 


$ find . -name '*.gif' -print | xargs file 


上 例 ，xargs 会 执行 file 命 令 。 不 过 ， 这 样 执行 的 话 可 能 会 出 错 ， 或 造成 安全 问题 ， 因 为 文 
件 名 可 能 包含 空格 或 换行 符 。 所 以 ,请 改 用 以 下 形式 。 这 样 ，find 的 输出 和 xargs 的 参数 的 分 界 
符 就 会 是 空 字符 ， 而 不 是 换行 符 了 。 


$ find . -name '*.gif' -printo | xargs -0 file 


xargs 会 发 起 多 个 进程 ， 所 以 如 果 是 处 理 大 量 文件 的 话 ， 不 要 期 望 它 性 能 有 多 好 。 

你 可 能 需要 在 xargs 的 末尾 加 上 两 个 连 字符 ( -- )， 以 防 有 文件 名 以 连 字符 开头 。 程 序 会 将 双 
连 字符 后 的 参数 都 当 作 文件 名 ， 而 不 是 选项 。 但 是 注意 ,不 是 所 有 的 程序 都 支持 双 连 字符 。 
使 用 find 的 时 候 ， 可 以 用 选项 -exec， 而 不 用 xargs。 不 过 它 的 语法 有 点 麻烦 ， 你 需要 加 上 一 
个 们 来 代表 文件 名 ， 以 及 一 个 字面 义 的 ;来 表示 命令 的 结束 。 以 下 是 用 find 来 改写 上 例 : 


$ find . -name '*.gif' -exec file {} \; 


11.10.5 expr 


如 果 需 要 在 shell 脚 本 中 进行 算术 操作 ， 可 使 用 expr ( 它 甚 至 能 进行 字符 串 操 作 )。 例 如 ， 命 
今 expr 1 + 2 会 输出 3。( 执行 expr --help， 查 看 所 有 的 运算 符 。) 

其 实 expz 做 算术 操作 效率 很 低 。 如 果 你 经 常 要 做 算术 操作 ， 你 可 以 改 用 Python ， 而 不 用 shell 
脚本 。 


11.10.6 exec 


exec 命 令 是 shell 内 置 的 ， 它 会 用 其 后 的 程序 的 进程 来 取代 你 当前 的 shell 进 程 。 它 用 到 了 第 1 
章 讲 到 的 exec()。 此 功能 的 目的 是 节省 系统 资源 ,但 记 住 ， 它 是 没有 返回 值 的 。 当 你 在 shell 肢 本 
中 运行 exec 的 时 候 ， 该 脚本 以 及 运行 该 脚本 的 shell 都 会 失踪 ， 而 被 exec 后 的 命令 顶替 。 
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你 可 以 在 shell 窗 口中 运行 exec cat 来 看 看 它 的 效果 。 当 你 按 下 CTRL-D 或 CTRL-C 的 时 候 ,shell 
窗口 就 会 消失 ， 因 为 已 经 没有 任何 子 进 程 了 。 
11.11 子 shell 


假设 你 要 稍微 改动 一 下 环境 变量 ， 


但 又 不 想 做 永久 的 改动 ,你 可 以 用 shell 变 量 3 
部 分 环境 变量 ( 例 pane 前 目录 )。 但 这 种 做 法 很 笨拙 。 
个 进程 来 运行 一 两 条 命令 。 间 


暂 存 和 恢复 

简单 的 做 法 是 使 用 子 shell， 即 新 开 一 

新 shel 复 制 了 源 shell 的 环境 变量 ， 而 在 其 退出 时 ， 你 对 其 环境 变量 的 
任何 更 改 却 不 会 影响 到 源 shell。 

将 命令 置 于 括号 中 ， 即 可 运行 子 shell。 例 如 下 面 这 行 命令 ， 它 在 uglydir 目 录 里 运行 了 
uglyprogram， 而 并 不 影响 源 shell: 
$ (cd uglydir; uglyprogram) 
以 下 是 一 个 为 避免 永久 改动 path 而 用 子 shell 来 操作 的 例子 
$ (PATH=/usr/confusing:$PATH; uglyprogram) 


用 子 shell 来 暂时 改变 一 个 环境 变量 是 很 常见 的 ， 且 因此 还 诞生 了 一 种 避免 写 子 shell 的 内 置 语法 : 
$ PATH=/usr/confusing:$PATH uglyprogram 


管道 和 后 台 进 程 可 以 与 子 shell 一 同 使 用 。 下 面 例子 的 意 
包 ， 并 在 target 目 录 中 解 包 。 这 一 做 法 很 高 
为 它 保 留 了 权限 ， 而 且 一 般 会 比 cp -z 快 ) 


思 是 , 用 tar 将 orig 下 的 整个 目录 树 扩 
效 地 复制 了 orig 中 的 文件 和 目录 (这 种 做 法 很 有 用 ， 因 
$ tar cf - orig | (cd target; tar xvf -) 

警告 运行 此 命令 之 前 ， 请 仔细 检查 ， 确 保 目标 命令 


存在 ， 并 且 与 源 目 录 是 
11.12 ”在 脚本 中 包含 其 他 文件 


点 〈. ) 运算 符 可 以 在 脚本 中 包含 其 他 文件 。 例 如 ， 下 例 表明 运行 了 config.sh 里 的 
. Cconfig.sh 


这 种 “包含 ”语法 不 会 开启 子 shell 


而 且 便 于 在 脚本 中 调用 配置 文件 
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11.13” 读 取 用 户 输 入 
read 命 令 可 以 将 标准 输入 的 内 容 读 取 到 变量 中 。 例 如 ， 以 下 命令 会 将 输入 置 于 $var: 


$ read var 


将 此 内 置 命令 与 本 书 未 提 及 的 其 他 shell 特 性 一 起 使 用 ， 能 实现 很 有 用 的 功能 。 


11.14 ”什么 时 候 〈 不 ) 应 该 使 用 shell 脚本 


shell 的 功能 之 丰富 ， 使 得 我 们 难以 用 区 区 一 章 讲 完 它 的 所 有 重点 。 如 果 你 想 知 道 shell 还 能 做 
些 什 么 ， 不妨 参 考 一 些 关于 shell 编 程 的 书籍 如 Stephen G Kochan 和 Patrick Wood 的 Unix Shell 
人 3rd edition( SAMS Publishing, 2003 ), 或 者 Bran W.Kernighan 和 Rob Pike 的 The UNIY 
Programming Environment (Prentice Hall，1984 ) 中 的 shell 脚 本 部 分 。 

然而 ， 在 某 些 情况 下 (尤其 是 你 准备 使 用 read 时 )， 你 应 该 反问 一 下 自己 ， 你 是 否 在 使 用 正 
确 的 工具 来 完成 这 项 工作 。 请 记 住 shell 脚 本 的 强项 : 操控 简单 的 文件 和 命令 。 如 前 面 提 到 的 ， 当 
你 发 现 你 的 脚本 写 得 有 点 繁琐 , 特别 是 涉及 复杂 的 字符 串 或 数学 处 理 时 , 或 许 你 就 该 试 试 Python、 
Per 或 awk 之 类 的 脚本 语言 了 。 
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本 章 考 察 在 网 络 上 的 机 器 之 间 传 输 和 分 享 文件 的 各 种 
方法 。 我 们 会 先 介 绍 一 些 scp 和 sftp 以 外 的 文件 复制 工具 ， 接 
着 再 看 看 真正 的 文件 分 享 ， 即 机 器 之 间 如 何 分 享 目录 。 


这 里 之 所 以 要 介绍 传输 文件 的 不 同方 法 , 是 因为 它们 针对 的 是 不 同 的 问题 。 有 时 你 只 想 向 不 
甚 了 解 的 机 器 提供 一 种 快速 、 暂 时 的 访问 途径 ， 有 时 你 需要 高 效 地 管理 大 量 目录 结构 , 或 者 有 时 
你 需要 的 是 固定 的 访问 。 


12.1 快速 复制 
假设 你 想 在 你 的 网 络 上 从 一 台 机 器 复制 文件 到 另 一 台 机 器 , 并 且 不 打算 复制 回来 或 进行 其 他 


操作 一 一 你 要 的 只 是 快 ， 那 么 ， 使 用 Python 就 是 一 种 方便 的 做 法 。 直 接 打开 该 文件 的 目录 ， 然 后 
执行 : 


$ python -m SimpleHTTPServer 


这 会 启动 一 个 基本 的 网 页 服务 器 ， 使 得 网 络 上 的 浏览 器 能 够 看 到 该 目录 。 它 通常 使 用 8000 端 
口 , 所 以 ， 如 果 你 在 10.1.2.4 的 机 器 上 运行 , 那么 , 到 http:/10.1.2.4:8000 就 可 以 获取 你 想 要 的 东西 。 


12.2 rsync 
如 果 你 想 移动 整个 目录 ， 可 用 scp -TY。 如 果 想 提高 速度 ， 那 就 用 tar 和 管 


$ tar cBvf - directory | ssh remote host tar xBvpf - 
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这 种 做 法 可 行 , 但 不 灵活 。 具 体 来 说 ,传输 结束 时 ， 在 远 端 的 那个 目录 可 能 并 不 真 的 就 是 本 
目录 的 副本 。 如 果 远 端 已 经 有 了 上 例 提 到 的 directory 目 录 ， 并 且 里 面包 含 其 他 文件 ， 那 么 传输 完 
成 时 ， 那 些 文件 会 是 依然 存在 的 。 

如 有 果 你 日 常 需 要 做 这 种 事情 ( 并 希望 自动 化 )， 可 用 一 些 专业 的 同步 系统 。rsync 是 Linux 平 
台 上 标准 的 同步 工具 ， 它 功能 多 样 ， 性 能 强大 。 接 下 来 我 们 会 介绍 一 些 实用 的 rsync 操 作 模 式 和 
它 的 一 些 奇特 之 处 。 


12.2.1 Tsync 基 础 


要 使 fsync 在 两 台 主 机 之 间 和 运作， 必须 让 它 在 源 机 器 和 目标 机 器 上 面 都 安装 。 接 着 ， 你 还 需 
要 知道 从 一 台 机 器 访问 另 一 台 机 器 的 方法 。 而 最 简单 的 方法 ， 就 是 使 用 远 端 的 shell 账 号 (假设 你 
想 用 SSH 方 式 传输 )。 其 实 ，rsync 还 可 以 在 同一 台 机 器 上 进行 文件 和 目录 的 复制 ， 例 如 从 一 个 文 
件 系统 复制 到 另 一 个 文件 系统 。 

表面 上 ，rsync 命 令 跟 scp 没 什么 区 别 。 事 实 上 ，rsync 可 以 使 用 相同 的 参数 。 例 如 ， 想 复制 
一 组 文件 到 你 名 为 host 的 机 器 的 home 目 录 ， 就 可 以 输入 : 


$ ITsync filel file2 ... host: 


在 所 有 现代 操作 系统 中 ，rsync 都 假设 你 是 用 SSH 连 接 远 端的 。 
小 心 这 种 报错 : 


rsync not found 
rsync: connection unexpectedly closed (0 bytes read so far) 
rsync error: error in rsync protocol data stream (code 12) at io.c(165) 


这 个 信息 是 说 ， 在 远 端 找 不 到 rsync。 如 果 远 端 安装 了 rsync ,但 没 在 路 径 中 ， 用 
--rsync-path=path 来 指定 远 端 中 它 的 位 置 。 

如 果 你 的 远 端 账号 跟 本 机 的 不 一 样 ， 那 就 在 主机 名 前 加 上 user@， 这 里 说 的 user 指 的 是 你 的 
名 为 host 的 远 端 账号 : 


$ rsync file1 file2 ... wser@host: 


除非 你 加 了 其 他 选项 ,不 然 rsync 就 只 复制 文件 。 事实 上 ， 如果 你 用 上 我 们 讲 过 的 那些 选项 ， 
并 加 上 一 个 叫 dir 的 目录 为 参数 ， 你 就 会 收 到 以 下 信息 : 


skipping directory dir 


想 要 完整 地 、 递归 地 传输 整个 目录 一 一 包括 符号 链接 、 权 限 、 模 式 、 设 备 一 一 那 就 用 -a 选项 。 
还 有 ， 如 果 你 想 复制 到 其 他 地 方 ， 而 不 是 你 的 home 目 录 ， 你 可 以 在 host 后 面 加 上 具体 地 址 ， 就 像 
这 样 : 
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$ rsync -a dir host:destination dir 


复制 目录 是 需要 技巧 的 ， 如 果 你 不 清楚 传输 过 程 中 会 发 生 什 么 ,你 可 以 使 用 -nv 选项 组 合 。 
-n 选 项 会 让 rsync 进 入 “ 空 跑 ” 模 式 , 即 模拟 复制 而 非 真 的 复制 。-v 选 项 则 是 元 长 模式 , 它 会 将 涉及 
的 文件 和 传输 过 程 的 细节 显示 出 来 : 


$ rsync -nva dir host:destination dir 


输出 大 概 会 是 这 样 : 


building file list ... done 
ml/nftrans/nftrans.html 

[more files] 

wrote 2183 bytes read 24 bytes 401.27 bytes/sec 


12.2.2 ”准确 复制 目录 结构 


默认 情况 下 ，isync 复 制 文件 或 目录 时 是 不 关心 目标 目录 的 原本 内 容 的 。 例 如 ， 如 果 你 把 
个 包含 文件 a 和 b 的 目录 d 复 制 到 另 一 台 机 融 ， 而 该 机 融 已 有 了 一 个 目录 da， 并 且 其 中 包含 文件 c， 
那么 经 rsync 传 输 过 后 ， 目 标 目 录 就 会 包含 有 a、b 、c 三 个 文件 。 

所 谓 准确 复制 ， 就 是 将 目标 目录 比 源 目录 多 出 的 内 容 清除 掉 ， 例 如 上 例 的 c 文 件 。 要 想 实现 
这 种 效果 ， 你 可 以 使 用 - -delete 选 项 : 


$ rsync -a --delete dir host:destination dir 


警告 ”这样 做 是 有 点 危险 的 ， 你 需要 检查 一 下 会 不 会 误 删 文件 。 记 住 ， 如 果 你 不 确定 传输 是 否 
能 达到 理想 结果 ， 可 先 以 -n 选 项 做 一 下 测试 ， 看 看 是 否 会 删除 文件 。 


12.2.3 ”以 斜 杠 结尾 
在 rsync 中 把 目录 作为 源 时 ， 要 特别 小 心 。 想 想 我 们 谈 过 的 传输 目录 的 基本 做 法 : 


$ rsync -a dir host:dest dir 


执行 过 后 ，host 机 器 的 dest_dir 下 就 会 有 了 目录 dir。 图 12-1 就 展示 了 这 种 情况 (假设 日 录 里 面 
有 文件 4 和 b )。 而 如 果 你 的 源 目 录 是 以 斜 杠 (/ ) 结尾 的 话 ， 则 是 另 一 番 景 象 ，; 


$ rsync -a dir/ host:dest dir 


图 灵 社 区 会 员 小 虎 (164142021@qq.com) 专 享 尊重 版 权 


12.2 ITSync 225 


这 样 的 话 ，rsync 就 会 直接 将 di 里 的 内 容 全 部 复制 到 dest_dir 中 ， 而 不 会 先 在 dest_dir 建 立 dir 
目录 。 因 此 ， 你 可 把 它 看 成 是 在 本 地 文件 系统 中 执行 cp dir/* dest_dir。 
假设 你 有 一 个 包含 文件 a 和 b 的 目录 dir， 然 后 你 执行 了 以 斜 杠 结尾 的 那个 版 本 的 命令 : 


$ rsync -a dir/ host:dest dir 


传输 过 后 , dest_dir 里 就 会 有 a 和 b 的 副本 , 但 并 无 目录 dir。 而 如 果 你 没有 加 斜 杜 , 那么 dest_dir 
得 到 的 将 会 是 目录 dir 的 副本 ( 里 面包 含 a 和 b )， 即 远 端 生成 了 dest_dir/dir/a 和 dest_dir/dir/b 这 样 的 
路 径 和 文件 。 从 图 12-2 我 们 可 以 看 出 ， 加 上 和 斜 杠 的 结果 是 不 同 于 图 12-1 的 。 

如 果 传 输 目 录 和 文件 时 不 小 心 加 上 了 和 斜 杠 ， 是 没什么 大 不 了 的 ,只 是 可 能 有 点 麻烦 而 已 。 你 
需要 到 远 端 去 建立 dir 目 录 ， 并 将 文件 放 回 去 。 需 要 担心 的 是 ， 如 果 你 不 幸 将 它 跟 --delete 选 项 结 
合 使 用 ， 那 就 可 能 会 误 删 无 就 的 文件 。 


目标 目录 
dest dir 


ISYNC -a dir host:dest dir 


图 12-1 一 般 的 rsync 复 制 


| | rsSync -a dir/ host:dest dir | Bl ] 
VR > 
ir 


图 12-2 ”和 斜 杠 结尾 的 效果 


注解 ”注意 shell 中 的 文件 名 补 全 功能 。GNU readline 以 及 其 他 补 全 库 可 能 会 给 完整 的 目录 名 加 上 
斜 杠 。 
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12.2.4 排除 文件 与 目录 


rsync 有 个 很 重要 的 功能 ， 就 是 它 可 以 排除 某 些 文件 与 目录 的 传输 。 比 如 说 ， 你 想 将 一 个 本 
地 目录 src 传 输 到 host， 但 想 排除 其 中 叫 .git 的 任何 东西 。 那 你 可 以 这 样 做 : 


$ rsync -a --exclude=.git src host: 


注意 ， 这 条 命令 会 排除 所 有 名 为 .git 的 文件 与 目录 ， 因 为 这 里 --exclude 获 得 的 是 模式 ， 而 非 
一 个 绝对 的 文件 名 。 要 想 排除 一 个 特定 的 项 目 ， 那 就 以 “/* 开 头 来 指定 一 个 绝对 路 径 ， 就 像 这 样 : 


$ rsync -a --exclude=/src/.git src host: 


注解 /src/.git 开 头 的 /不 是 指 你 系统 的 home 目 录 ， 而 是 指 源 目录 所 在 的 位 置 。 


以 下 还 有 一 些 按 模式 进行 排除 的 技巧 。 

口 - -exclude 选 项 可 以 有 多 个 。 

口 常用 的 模式 可 保存 在 文本 文件 中 (一行 一 个 模式 )， 并 用 - -exclude-from=file。 

口 只 想 排除 名 为 item 的 目录 ， 不 想 排除 名 为 item 的 文件 ， 可 以 斜 杠 结尾 : --exclude=item/。 
口 模式 匹配 是 以 一 个 完整 的 文件 名 为 单位 的 ， 模 式 可 包含 通配符 。 例 如 ，t*s 能 与 this 匹 配 ， 
但 不 与 ethers 匹 配 。 

口 如 果 你 发 现 你 要 排除 的 内 容 太 多 了 ， 你 也 可 以 用 --include 来 指定 要 包含 的 文件 或 目录 。 


12.2.5 合并、 检查 及 元 长 模式 


为 了 提高 效率 ，rsync 会 先 快速 检查 一 下 目标 位 置 是 否 已 包含 源 内 容 。 这 种 快速 检查 只 看 文 
件 大 小 及 最 后 修改 时 间 。 在 你 第 一 次 将 整个 目录 结构 传输 到 远 端 时 ，rsync 发 现 远 端 并 不 存在 任 
何 这 些 文件 ， 于 是 它 就 整 份 传输 过 去 。 你 可 以 用 rsync -n 来 验证 。 
传输 过 一 次 之 后 ， 再 用 rsync -v 做 一 次 。 你 会 发 现 这 次 的 文件 列表 为 空 ， 那 是 因为 目标 位 置 
已 有 了 源 内 容 ， 并 且 修 改 时 间 也 一 致 。 
当 源 文件 与 目标 文件 不 一 致 时 ，rsync 会 对 远 端 的 文件 进行 覆 写 。 那 么 ， 之 前 提 到 的 快速 检 
查 功能 就 可 能 不 够 用 了 ， 因 为 你 可 能 还 需要 更 准确 地 验证 两 边 文件 是 否 一 样 ， 以 免 rsync 错 误 地 
略 过 它们 ， 又 或 者 说 你 想 要 更 多 安全 保障 。 这 时 ， 你 可 以 求助 于 以 下 这 些 选 项 。 
口 --checksum (缩写 -c ): 通过 计算 文件 的 校 验 和 ( 大 部 分 情况 下 是 唯一 的 ) 来 检查 一 致 性 。 
这 会 消耗 更 多 的 VO 和 CPU 资 源 ， 但 如 果 你 想 准 确 地 传输 ， 又 担心 文件 大 小 不 足以 判断 一 
致 性 ， 那 么 这 个 选项 就 是 必须 的 。 
口 --ignore-existing: 不 覆 写 已 存在 的 文件 。 
口 --packup (缩写 -b ): 不 覆 写 已 存在 的 文件 , 只 在 传输 前 给 它们 加 上 “~ 后缀 , 为 它们 重 命名 。 
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口 --suffix=s: 将 --backup 用 的 后 缀 ~ 改 为 s。 
口 --update (缩写 -u): 当 目 标 文件 的 修改 时 间 比 源 文件 的 更 早 时 ， 才 进行 覆 写 。 

在 没有 使 用 什么 特别 选项 时 ，rsync 的 运行 会 是 悄 无 声息 的 ， 只 在 遇 到 错误 时 才 会 有 输出 。 
你 可 以 用 rsync -v(〈 宛 长 模式 ) 来 显示 传输 过 程 的 细节 ， 甚 至 用 rsync -vv 来 显示 得 更 细 。( v 越 多 
则 越 详细 ， 但 两 个 v 通 常 已 足够 。) 想 在 传输 过 后 得 到 一 些 综合 信息 ， 可 用 rsync --stats。 


12.2.6 ”压缩 
很 多 人 喜欢 在 用 -a 的 时 候 加 上 -z， 以 在 传输 前 先进 行 压缩 


$ rsync -az dir host:destination dir 


某 些 情况 下 ， 压 缩 是 能 加 快 传输 速度 的 , 例如 说 上 行 缓慢 , 或 者 说 延迟 很 多 ,而 你 又 要 传输 
大 量 文件 的 情况 时 。 然 而 ， 如 果 网 络 很 快 ,那么 压缩 和 解压 的 过 程 会 占用 较 多 CPU 时 间 ， 此 时 反 
而 不 做 压缩 会 传 得 更 快 些 。 


12.2.7 ”限制 带宽 


上 传 大 量 数据 时 , 可 能 会 堵塞 上 行 线路 。 尽管 这 并 不 占用 下 行 线 路 , 但 如 果 不 限制 上 传 速度 ， 
其 实 也 是 会 影响 下 行 的 。 因 为 发 出 的 TCP 包 ( 如 HTTP 请 求 ) 需要 与 你 的 文件 传输 争夺 带宽 。 要 
想 避 免 这 种 情况 ， 可 用 --bwlimit 来 给 你 的 上 行 线路 留 点 空间 。 例 如 ， 若 要 令 其 上 行 带宽 的 上 限 
为 10 000Kbps， 可 这 么 做 : 


$ rsync --bwlimit=10000 -a dir host:destination dir 


12.2.8” 传 文件 到 你 的 计算 机 


Tsync 不 仅 能 从 本 机 传 文件 到 远 端 ， 还 能 从 远 端 传 文件 到 本 机 ， 你 只 需 将 远 端 主机 名 和 远 端 
文件 路 径 作为 第 一 个 参数 即 可 。 因 此 , 想 将 远 端 host 的 src_dir 传 到 本 机 的 dest_dir， 就 可 以 这 样 写 


$ rsync -a host:src dir dest dir 


注解 之 前 也 提 过 ， 不 填 主机 名 host: 的 话 ， 意 味 着 是 在 本 机 上 进行 文件 复制 。 


12.2.9 ”更 多 有 关 rsync 的 话题 


无 论 何 时 ，rsync 都 应 该 是 文件 复制 的 首选 工具 之 一 。rsync 的 批量 模式 很 有 用 ， 它 会 用 到 一 
些 辅助 文件 来 记录 状态 日 志 。 状 态 日 志 能 使 中 断 的 长 时 传输 恢复 得 更 快捷 。 
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rsync 还 能 用 于 备份 。 例 如 ， 你 可 以 接 上 一 些 网 络 硬盘 ， 如 Amazon 的 S3 ， 到 你 的 Linux 系 统 ， 
然后 使 用 rsync --delete 来 定期 地 进行 文件 同步 ， 这 样 的 备份 系统 是 很 高 效 的 。 

没 谈 到 选项 还 有 很 多 。 想 大 概 了 解 下 的 话 ， 可 运行 rsync --help 来 查看 。 此 外 ，rsync(1) 帮 助 
手册 及 其 主页 http://rsync.samba.org/ 也 提供 了 详细 的 参考 信息 。 


12.3 ”文件 共享 


你 的 网 络 中 应 该 不 只 有 你 一 台 Linux 机 器 ， 而 在 拥有 多 台 机 器 的 网 络 中 ， 很 多 时 候 我 们 都 需 
要 进行 文件 共享 。 在 本 章 剩 下 的 内 容 中 , 我 们 主要 关注 与 Windows 或 Mac OS X 的 文件 共享 ， 因 为 
了 解 Linux 与 其 他 平台 的 适 配 是 挺 有 趣 的 。 而 对 于 在 Linux 机 器 之 间 分 享 文件 ， 或 访问 网 络 区 域 存 
储 (Network Area Storage， 以 下 简称 NAS ) 中 的 文件 ,我们 会 简单 介绍 一 下 ， 看 一 下 怎样 以 客户 
身份 使 用 网 络 文件 系统 (Network File System， 以 下 简称 NFS )。 


12.4 用 Samba 分 享 文件 


如 果 你 有 机 顺和 运行 着 Windows， 你 可 能 想 允 许 它 通过 标准 的 Windows 网 络 协议 一 一 服务 器 消 
息 块 (Server Message Block， 以 下 简称 SMB ) 来 访问 你 Linux 系 统 的 文件 和 打印 机 。Mac OS X 也 
支持 SMB 文 件 共享 。 

Unix 的 标准 文件 共享 套件 叫 作 Samba。 它 不 只 能 让 Windows 机 需 访问 Linux 系 统 , 还 能 反 过 
来 一 一 用 Linux 上 的 Samba 客 户 端 访 问 和 打印 Windows 服 务 器 上 的 文件 。 

要 建立 Samba 服 务 器 ， 可 跟从 以 下 步 又: 

(1) 创建 smb.conf 文 件 ; 

(2) 在 smb.conf 中 加 入 文件 共享 小 节 ; 

(3) 在 smb.conf 中 加 入 打印 机 共享 小 节 ; 

(4) 启动 Samba 守 护 进程 nmbd 和 smbd。 

当 你 安装 发 行 版 的 Samba 包 时 ， 你 的 系统 会 执行 以 上 的 步骤 ， 并 给 予 Samba 服 务 需 合理 的 设 
置 。 然 而 ， 它 无 法 为 你 决定 你 想 要 共享 什么 东西 。 


注解 ”本 章 关 于 Samba 的 介绍 是 很 简单 的 ， 而 且 仅 限于 让 单个 子 网 中 的 Windows 机 器 通过 网 上 令 
居 来 查看 Linux 机 器 。 因为 访问 控制 和 网 络 拓扑 也 有 各 种 可 能 性 , 所 以 配置 Samba 的 方法 无 
穷 无 尽 。 想 知道 大 规模 服务 器 的 配置 方法 ,参考 Using Samba, 3rd edition ( O’Reilly，2007 ) 
这 本 书 ， 里 面谈 到 的 东西 很 广泛 。 另 外 ， 也 可 参考 Samba 的 网 站 http://www.samba.org/。 


12.4.1 配置 服务 器 


Samba 的 核心 配置 文件 是 smb.conf， 大 多 数 发 行 版 都 会 将 它 置 于 etc 目 录 中 ， 如 /etc/samba。 然 
而 ， 也 有 可 能 会 被 放 在 了 lib 目 录 中 ， 如 /usr/local/samba/lib。 
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smb.conf 的 格式 类 似 于 XDG 风 格 ( 如 systemd 配 置 文件 的 格式 )， 并 分 为 不 同 的 小 节 ， 每 节 的 
名 称 以 方 括 号 包围 (例如 [global] 和 [printers] )。[global] 节 包含 了 应 用 于 整个 服务 右 和 所 有 共 
享 的 通用 选项 。 这 些 选 项 主要 是 关于 网 络 配置 和 访问 控制 的 。 以 下 [global] 例 子 展 示 了 如 何 设置 
服务 器 名 字 、 摘 述 和 工作 组 : 


[global] 

# server name 

netbios name = name 

# server description 

server string = My server via Samba 
# workgroup 

workgroup = MYNETWORK 


这 些 参 数 的 含义 如 下 所 示 。 

D netbios name: 服务 器 名 字 。 如 果 没 填 ， 则 Samba 会 用 Unix 主 机 名 。 

口 server string: 关于 服务 需 的 简短 描述 。 默 认 是 Samba 的 版 本 号 。 

口 workgroup: SMB 工 作 组 名 字 。 如 果 你 在 Windows 域 中 ， 那 就 把 该 参数 设 为 Windows 域 的 
名 字 。 


12.4.2 ”服务 器 访问 控制 


你 可 以 在 smb.conf 中 添加 选项 来 限制 那些 能 访问 你 Samba 服 务 器 的 机 器 和 用 户 。 以 下 列举 的 
是 一 些 包括 了 很 多 可 设 在 [global] 节 和 访问 控制 节 的 选项 〈 稍 后 讲解 )。 
口 interfaces: 使 Samba 监 听 某 个 网 络 或 接口 。 例 如 : 


interfaces = 10.23.2.0/255.255.255.0 
interfaces = etho 


口 bind interfaces only: 使 用 interfaces 选 项 时 ， 将 此 选项 设 为 yes， 以 使 Samba 只 对 指定 
的 接口 服务 。 
口 valid users: 只 人 允许 指定 的 用 户 访问 Samba， 例 如 : 


valid users = jruser, bill 


口 guest ok: 设 为 true 则 会 使 共享 对 网 络 上 的 匿名 用 户 可 见 。 

D guest only: 设 为 true 则 是 只 允许 匿名 用 户 访问 。 

口 browseable: 设置 网 络 浏览 器 是 否 可 见 共 享 资 源 。 设 为 no 时 ， 要 指定 具体 名 字 才 能 访问 共 
享 内 容 。 


12.4.3 ”密码 


一 般 来 说 ,访问 Samba 服 务 器 应 该 先 通过 密码 验证 。 不 垃 的 是 ，Unix 的 基本 密码 系统 跟 
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Windows 的 是 不 一 样 的 ， 所 以 ， 除 非 你 指定 了 明文 的 网 络 密 码 或 Windows 服 务 器 验证 密码 ， 否 则 
你 必须 要 有 另 一 套 密码 系统 。 本 节 会 教 你 如 何 用 Samba 的 Trivial Database ( 即 TDB ) 后 端 建立 一 
套 密码 系统 ， 它 很 适合 于 小 型 网 络 。 

首先 ， 在 smb.conf 的 [global] 节 中 创建 以 下 条 目 ， 来 定义 Samba 密 码 数据 库 的 特性 : 


Vr 


# use the tdb for Samba to enable encrypted passwords 
security = user 

passdb backend = tdbsam 

obey pam restrictions = yes 

smb passwd file = /etc/samba/passwd_smb 


这 几 行 代码 能 让 你 通过 smbpasswd 来 操作 Samba 密 码 数 据 库 。obey pam restrictions 参 数 保 证 
了 用 户 通过 smbpasswd 修 改 密码 时 需要 遵照 PAM 的 规则 。 而 对 于 passdb backend 参 数 ， 你 还 可 以 在 
冒号 后 指定 TDB 文 件 的 路 径 ， 如 tdbsam: /etc/samba/private/passwd.tdb。 


注解 ”如 果 你 使 用 Windows 域 ， 你 可 以 设置 security = domain 以 令 Samba 使 用 域 的 用 户 名 ， 而 无 
需 密 码 数 据 库 。 然 而 ， 这 要 求 两 端的 用 户 名 必须 要 一 致 。 


添加 和 删除 用 户 
为 了 让 Windows 用 户 能 访问 Samba 服 务 器 ， 你 必须 先 用 smbpasswd -a 来 把 windows 用 户 的 用 户 
名 添加 到 数据 库 中 : 


# smbpasswd -a wsername 


username 参 数 必须 是 Linux 系 统 中 有 效 的 用 户 名 。 

跟 passwd 程 序 一 样 , smbpasswd 也 会 让 你 为 新 用 户 输入 两 次 密码 。 如 果 密 码 能 通过 必要 的 安全 
侈 查 ， 则 新 用 户 就 会 被 创建 。 

要 移 除 用 户 ， 则 用 -x 选 项 : 


# smbpasswd -x wsername 


-d 选 项 可 令 用 户 暂 时 失效 ; 而 -e 选 项 则 可 将 用 户 重新 激活 : 


# smbpasswd -d wsername 
# smbpasswd -e Wsername 


修改 密码 
超级 用 户 可 不 加 任何 选项 或 关键 字 就 直接 更 改 任何 一 个 用 户 的 Samba 密 码 : 


# smbpasswd wsername 


然而 , 如 果 Samba 服 务 器 是 在 运行 中 , 则 任何 用 户 都 可 通过 在 命令 行 输入 smbpasswd 来 修改 自 
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己 的 密码 。 
最 后 , 配置 中 还 有 一 点 是 需要 注意 的 , 即 如 果 你 在 smb.conf 中 看 到 这 样 的 一 行 , 那 就 要 小 心 了 : 


unix password sync = yes 


这 行 会 使 smbpasswd 在 改 Samba 密 码 的 同时 也 改 反 Linux 密 码 。 这 可 能 会 给 人 带 来 困扰 ， 尤 其 
是 当 用 户 将 密码 修改 为 非 Linux 登 录 密 码 后 ， 却 发 现 不 能 登录 Linux 了 。 有 些 发 行 版 的 Samba 包 正 
是 默认 设 为 yes 的 ! 


12.4.4 ”启动 服务 器 


如 果 你 不 是 用 发 行 版 的 Samba 包 来 安装 ， 那 么 你 可 能 需要 自己 启动 服务 器 。 你 要 做 的 是 用 以 
下 参数 来 运行 hImbd 和 smbd， 而 其 中 的 smb_config file 是 你 smb.conf 文 件 的 完整 路 径 ; 


# nmbd -D -s smb config file 
# smbd -D -s smb config file 


nmbd 守 护 进程 是 一 个 NetBIOS 名 字 服 务 絮 ， 而 smbd 才 是 真正 处 理 共 享 请 求 的 进程 。-D 选 项 用 
于 指定 它们 以 守护 进程 模式 运行 。 如 果 你 在 smbd 运 行 期 间 修改 了 smb.conf 文 件 ， 你 可 以 用 HUP 信 
号 通知 守护 进程 重读 配置 ， 或 用 你 发 行 版 的 服务 重启 命令 (例如 systemct1l 或 initctl ) 来 做 到 。 


12.4.5 ”诊断 和 日 志文 件 


如 果 Samba 服 务 器 启动 过 程 中 出 错 ， 那 么 错误 信息 就 会 出 现在 命令 行 上 。 但 运行 时 的 诊断 信 
息 是 去 到 log.nmbd 和 log.smbd 文 件 的 ， 它 们 通常 在 warvlog 目 录 中 ， 如 /varlog/samba。 在 那里 你 还 
可 以 看 到 其 他 日 志文 件 ， 例 如 每 个 客户 单独 的 日 志文 件 。 


12.4.6 ”配置 文件 共享 


要 向 SMB 客 户 输出 一 个 目录 ( 即 与 客户 共享 一 个 目录 )， 需 要 在 你 smb.conf 文 件 中 添加 如 下 
这 样 的 一 个 小 节 。 其 中 1abel 是 该 共享 的 名 称 ，path 是 目录 的 完整 路 径 。 
[7ape7] 
path = path 
comment = share description 
guest ok = no 


writable = yes 
printable = no 


以 下 参数 对 于 目录 共享 是 很 有 帮助 的 。 

D guest ok: 允许 访客 访问 ， 与 public 参 数 同 义 。 

口 writable: 设 为 yes 或 true， 表 示 该 共享 可 读 可 写 。 千 万 不 要 给 一 个 访客 可 访问 的 共享 设 
置 可 读 可 写 。 
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口 printable: 设置 为 共享 打印 机 。 如 果 是 目录 共享 ， 那 就 要 设 为 no 或 false。 
D veto files: 符合 模式 的 文件 将 不 参与 共享 。 每 个 模式 用 斜 杠 包围 〈 像 /pattern/ 这 样 )。 
例如 ，veto files = /*.0/bin/ 这 条 命令 会 屏蔽 对 象 文件 以 及 所 有 叫 bin 的 文件 和 目录 。 


12.4.7 ”home 目录 
你 可 以 在 smb.conf 文 件 里 添加 [homes] 节 ， 以 使 home 目 录 能 被 共享 。 这 个 节 大 概 是 这 样 : 


[homes] 

comment = home directories 
browseable = no 

writable = yes 


默认 地 ，Samba 会 读 取 登 录用 户 的 /etc/passwd 条 目 来 获知 他 们 的 home 目 录 。 然 而 ， 如 果 你 不 
想 用 默认 的 做 法 ( 即 你 想 让 Windows 的 home 目 录 与 Linux 的 不 同 ), 那 你 可 以 在 path 参 数 处 使 用 %s。 
例如 ， 下 例 就 可 以 将 一 个 用 户 的 [homes] 目 录 切 换 成 /auser: 


path = /u/%S 


Samba 会 将 %s 蔡 换 成 当前 的 用 户 名 。 
12.4.8 共享 打印 机 


你 可 以 通过 在 smb.conf 文 件 中 加 入 [printers] 节 来 共享 打印 机 。 以 下 是 使 用 标准 Unix 打 印 系 
统 CUPS 时 [printers] 节 的 配置 : 


[printers] 

comment = Printers 
browseable = yes 
printing = CUPS 
path = cups 
printable = yes 
writable = no 


要 使 用 printing = CUPS 参 数 ， 你 的 Samba 必 须 配 置 和 连接 了 CUPS 库 。 


注解 ”根据 你 的 需要 ， 你 可 能 还 想 配置 guest ok = yes， 以 允许 访客 访问 你 的 打印 机 ， 而 不 是 直 
接 派 发 账号 密码 ， 因 为 用 防火 墙 限制 打印 机 访问 是 很 容易 的 。 
12.4.9 使 用 Samba 客 户 端 


Samba 的 客户 端 程序 smbclient 可 以 访问 Windows 共 享 。 当 你 需要 与 Windows 服 务 器 交互 时 ， 
这 个 工具 能 让 你 仍 按 Unix 风 格 来 工作 


TI 


O 
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用 -L 选 项 列 出 名 为 SERVER 的 远 端 的 共享 : 


$ smbclient -L -U wsername SERVER 

如 果 你 的 Linux 用 户 名 与 远 端 的 用 户 名 一 样 ， 就 不 需要 -U username。 

输入 命令 后 , smbclient 就 会 问 你 密码 。 若 要 以 访客 身份 访问 , 就 直接 回 车 , 否则 输入 SERVER 
的 密码 。 成 功 后 ， 你 就 会 看 到 以 下 结 


Sharename Type Comment 

Software Disk Software distribution 
Scratch Disk Scratch space 

IPC$ IPC IPC Service 

ADMIN$ IPC IPC Service 


printer1 Printer Printer in room 231A 
Printer2 Printer Printer in basement 


可 以 根据 Type 字 段 来 搞 清 楚 每 行 的 作用 ， 并 只 关注 Disk 和 Printer 共 享 ( IPC 共 享 属 于 远程 管 
理 )。 这 个 列表 包含 了 两 个 共享 硬盘 和 两 个 共享 打印 机 。 可 用 Sharename 一 列 的 名 字 来 访问 它们 。 
12.4.10 ”作为 客户 去 访问 文件 


如 果 你 只 是 随意 访问 共享 硬盘 上 的 文件 , 可 用 以 下 命令 。( 同样 ， 如 果 你 Linux 用 户 名 与 远 端 
的 一 致 ， 可 以 去 掉 -U username。) 


$ smbclient -U wsername '\\SERVER\ sharename' 


成 功 执行 后 ， 你 会 看 到 以 下 提示 ， 意 味 着 你 可 以 开始 传输 文件 了 : 


smb: \> 


在 此 种 传输 模式 下 ，smbclient 跟 Unix 的 ftp 命 令 是 很 像 的 ， 你 可 以 运行 下 列 命令 。 
D get file: 将 远 端 的 文件 file 复制 到 本 机 当前 目录 。 
D put file: 将 本 机 文件 file 复 制 到 远 端 。 
D cd dir: 跳 到 远 端 的 dir 目 录 。 
D lcd localdir: 跳 到 本 机 的 localdir 目 录 。 
口 pwd: 打印 出 远 端 的 当前 目录 ， 包 括 服务 需 与 共享 的 名 称 。 
口 !comand: 在 本 机 执行 命令 command。 可 以 用 !pwd 和 !1s 来 查看 本 机 的 当前 目录 和 目录 中 的 文件 。 
口 help: 显示 所 有 可 用 命令 。 
使 用 CIFS 文 件 系 统 
如 果 你 要 经 常 访问 Windows 服 务 器 上 的 文件 ,你 可 以 通过 mount 来 将 一 个 共享 附加 到 你 的 系统 
上 , 语法 如 下 。 注 意 是 SERVER:sharename 格 式 ， 而 不 是 一 般 所 见 的 \\SERVER\sharename。 


# mount -t cifs SERVER:sharename mountpoint -0 user=Wsername,pass=password 
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要 像 这 样 使 用 mount ， 你 的 Samba 要 先 能 使 用 通用 互联 网 文件 系统 ( Common Internet File 
System， 以 下 简称 CIFS )。 大 多 数 发 行 版 会 在 Samba 包 以 外 提供 。 


12.5 NFS 客户 端 


Unix 系 统 中 标准 的 文件 共享 系统 是 NFS 不同 版 本 的 NFS 适 用 于 不 同 的 情境 。 你 可 以 通过 TCP 
和 UDP 来 提供 NFS 服 务 ， 并 加 上 一 大 堆 验 证 和 加 密 技术 。 正 因为 选择 繁多 ， 所 以 NFS 是 个 很 大 的 
话题 ， 所 以 我 们 只 讲 讲 NFS 客 户 端的 一 些 基 本 知识 。 

想 在 一 个 服务 器 上 通过 NFS 挂 载 一 个 远程 目录 ， 可 使 用 与 挂 载 CIFS 相 同 的 语法 : 


# mount -t nfs server:directory mountpoint 


技术 上 来 说 ， 你 应 该 不 用 指定 -t nfs， 因 为 mount 会 帮 你 识别 。 但 你 可 能 也 想 了 解 帮 助手 册 
nfs(5) 里 的 选项 。( 你 会 看 到 sec 选 项 可 使 用 好 几 种 不 同 的 安全 策略 。 很 多 小 型 的 、 封 闭 的 网 络 的 
管理 员 会 使 用 基于 主机 的 访问 控制 。 而 更 复杂 的 那些 方法 ， 如 基于 Kerberos 的 验证 ， 需 要 额外 的 
配置 文件 。 ) 

当 你 发 现 网 络 上 的 文件 系统 使 用 量 很 大 时 , 那 就 建立 自动 挂 载 吧 , 使 得 文件 系统 在 被 需要 使 
用 时 才 挂 载 ， 以 避免 开机 时 出 现 堵塞 而 产生 依赖 问题 。 传 统 的 自动 挂 载 工具 是 automount ， 它 的 
新 版 叫 作 amd， 但 他 们 都 正在 被 systemd 的 自动 挂 载 单元 取代 。 


12.6 ”有 关 网 络 文件 服务 的 选择 与 局 限 的 更 多 内 容 


创建 NFS 服 务 器 来 共享 文件 比 使 用 NFS 客 户 端 要 更 复杂 ,你 需要 运行 服务 器 守护 进程 ( mountd 
和 nfsd )， 并 建立 /etc/exports 文 件 来 反映 你 分 享 的 目录 。 然 而 , 我们 不 会 在 此 话题 上 展开 太 多 ， 
为 直接 购买 一 个 NAS 设 备 会 更 方便 。 这 种 设备 很 多 都 是 基于 Linux 的 ， 所 以 它们 自然 支持 NFS 服 
务 器 。 供 应 商会 附加 一 些 他 们 自制 的 管理 工具 ， 来 帮 你 轻松 解决 一 些 无 聊 的 任务 ， 如 RAID 配 置 
和 去 备份 。 

讲 到 云 备份 ,有 种 网 络 文件 服务 叫 云 存储 。 如 果 你 需要 自动 备份 的 功能 而 不 要 求 什么 高 性 能 ， 
那 它 就 很 适合 你 。 尤 其 是 那些 你 不 常用 的 文件 ,通通 可 以 放 到 云 存储 中 。 你 可 以 像 使 用 NFS 那 样 
使 用 它 。 

NFS 和 其 他 文件 共享 系统 应 付 一 般 的 使 用 是 没 问题 的 ,但 别 指望 它们 拥有 强大 的 性 能 。 对 大 
文件 的 只 读 访问 通常 没什么 问题 ,例如 流 式 地 读 取 音频 和 视频 ， 因 为 那些 内 容 是 连续 的 、 可 预测 
的 ,并 且 不 需要 太 多 的 服务 器 与 客户 端 之 间 的 往返 。 只 要 网 络 够 快 ， 且 客户 端的 内 存 够 大 ， 服 务 
器 就 能 持续 地 供应 你 想 要 的 数据 。 

使 用 本 地 存储 能 更 快速 地 处 理 涉及 大 量 小 文件 的 任务 , 例如 编译 软件 包 和 启动 桌面 环境 。 当 
网 络 变 得 更 大 、 机 器 间 的 交流 变 得 更 多 时 ， 事 情 就 变 得 更 复杂 ， 因 为 你 需要 在 便捷 程度 、 性 能 高 
低 及 管理 难 易 之 间作 出 权衡 。 
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本 书 主要 关注 Linux 系 统 的 服务 器 进程 和 交互 式 的 用 户 
会 话 。 但 系统 与 用 户 最 终 是 需要 有 交汇 点 的 。 启动 文件 在 这 
一 点 上 就 发 挥 着 重要 的 作用 ， 因 为 它们 为 shell 和 其 他 交互 式 
程序 设 定 了 默认 的 参数 。 它们 决定 了 用 户 登 录 时 所 能 看 到 的 
系统 的 模样 。 


大 多 数 用 户 平时 是 不 太 关心 启动 文件 的 , 只 会 在 想 要 添加 一 些 方便 功能 时 才 接触 它们 , 例如 

添加 别名 。 随 着 时 间 推 移 ， 这 些 文件 便 充斥 了 不 必要 的 变量 和 测试 ， 从 而 导致 一 些 麻 烦 ( 其 至 严 
重 ) 的 问题 。 
如 果 你 的 Linux 机 噩 已 经 用 了 好 一 段 时 间 ， 你 会 发 现 你 的 home 目 录 积 累 了 大 量 的 启动 文件 。 
他 们 通常 会 被 称 为 dot 文 件 ， 只 因 它 们 的 文件 名 以 点 ( dot ) 开头 。 它 们 很 多 是 在 某 些 程序 初次 启 
动 时 产生 的 ,而 一 般 人 是 不 会 去 更 改 它们 的 。 本 章 主要 讲解 shell 启 动 文件 。 这 些 文件 你 很 可 能 会 
修改 甚至 完全 改写 。 现 在 来 看 看 你 需要 为 此 花 多 少 心思 。 


13.1 创建 启动 文件 的 规则 


设计 局 动 文件 时 ， 要 考虑 到 用 户 。 如 果 该 机 器 只 有 你 在 用 , 那 就 不 用 太 担 心 ,因为 有 问题 也 
只 会 影响 到 你 ,而 且 容 易 修 复 。 但 如 果 你 创建 的 启动 文件 是 该 机 器 或 该 网 络 所 有 新 用 户 的 默认 配 
置 ,或 者 说 它 会 被 复制 到 其 他 机 器 上 使 用 , 那么 这 设计 任务 就 变 得 艰巨 了 。 如 果 你 的 启动 文件 在 
10 个 用 户 那里 出 错 ， 那 你 就 要 为 此 进行 10 次 修复 工作 。 

为 别 的 用 户 创建 启动 文件 时 ， 必 须要 记 住 以 下 两 点 。 

口 简单 : 启动 文件 的 数量 和 内 容 都 要 尽 可 能 地 少 ， 以 使 它们 易 守 难 攻 。 因 为 每 多 一 个 项 目 ， 
就 意味 着 多 一 个 突破 口 。 
口 可 读 : 添加 注释 ,方便 用 户 了 解 文 件 的 每 一 部 分 有 什么 用 。 
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13.2” 何 时 需要 修改 启动 文件 


在 修改 一 个 启动 文件 之 前 , 先 反 省 一 下 , 真 的 非 修改 不 可 ?以 下 才 是 修改 启动 文件 的 充分 理由 。 
口 你 想 改 变 默 认 提 示 。 
口 你 需要 提供 一 些 关键 的 本 地 安装 软件 。( 但 还 是 建议 你 先 考虑 使 用 wrapper 脚 本 。) 
口 现存 的 启动 文件 有 错漏 。 

如 果 本 来 你 的 Linux 运 作 正 常 ， 那 更 要 小 心 了 。 另 外 ， 有 些 默认 的 启动 文件 会 与 /etc 里 的 其 他 
文件 交互 。 
虽然 说 了 这 么 多 , 但 如 果 你 对 修改 默认 配置 没有 兴趣 ,那么 你 是 不 需要 阅读 本 章 的 ， 所 以 我 
们 只 挑 重要 的 内 容 讲 。 


13.3 ”shell 启动 文件 的 元 素 


shell 启 动 文件 里 该 有 什么 ?明显 地 , 需要 有 命令 路 径 和 提示 符 的 配置 。 但 命令 路 径 和 提示 符 
具体 应 该 是 怎样 的 呢 ? 还 有 ， 启 动 文件 里 放 多 少 东 西 才 算是 过 多 呢 ? 
接 下 来 的 几 个 小 节 将 讨论 shell 启 动 文件 的 必要 元 素 一 一 路 径 、 提 示 符 、 别 名 以 及 权限 掩 码 。 


13.3.1 命令 路 径 


shell 启 动 文件 中 最 重要 的 就 是 命令 路 径 。 该 路 径 应 包含 用 户 要 用 到 的 所 有 应 用 程序 所 在 的 目 
录 。 至 少 ， 按 照 顺 序 应 包含 这 些 : 


/usr/local/bin 
/usr/bin 
/bin 


这 个 顺序 可 确保 你 能 使 用 /usr/local 中 的 特定 变 体 来 覆盖 默认 程序 。 

大 多 数 Linux 发 行 版 中 , 几乎 所 有 软件 包 都 会 被 安装 到 /usrbin 中 。 但 还 要 留意 一 些 少数 情况 ， 
例如 游戏 会 放 在 /usr/games 中 ， 而 图 形 应 用 又 放 在 男 外 的 地 方 。 所 以 先 检查 下 你 系统 的 默认 设置 ， 
然后 确保 所 有 常用 的 程序 都 能 在 以 上 目录 找到 。 如 果 找 不 到 , 那么 你 的 系统 可 能 就 没 法 用 了 。 不 
要 为 了 迁就 新 装 软件 的 目录 而 改变 默认 的 命令 路 径 。 为 了 适应 分 散 的 软件 目录 , 你 可 以 用 一 个 简 
单 的 方法 ， 就 是 将 那些 软件 的 符号 链接 放 到 /usr/local/bin 中 。 

很 多 人 喜欢 在 自 有 的 bin 目 录 中 放置 shell 脚 本 和 程序 ,所 以 你 可 以 将 以 下 这 行 放 在 命令 路 径 的 
开头 : 


$HOME/bin 


注解 ”有 种 新 的 惯用 方法 是 将 二 进 制 文件 放 在 $HOME/ .local/bin 中 。 
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如 果 你 对 系统 工具 感 兴 趣 ( 例如 traceroute、ping 和 lsmod )， 可 以 为 路 径 加 上 sbin 目 录 : 


如 | 


/usr/local/sbin 
/usr/sbin 
/sbin 


在 命令 路 径 里 加 点 (.) 
命令 路 径 中 还 有 个 烦 有 争议 性 的 小 元 素 : 点 (. )。 命令 路 径 中 有 了 点 的 话 ， 你 就 不 用 在 程序 
名 前 加 ./ 即 能 直接 运行 当前 目录 中 的 程序 。 这 看 上 去 很 便于 写 脚 本 和 编译 程序 ， 但 其 实 是 有 问题 
的 ， 主 要 有 以 下 两 个 原因 。 
口 可 能 会 导致 安全 问题 。 永 远 不 要 将 点 放 在 命令 路 径 的 前 端 。 考 虑 一 下 可 能 会 发 生 的 后 果 : 
黑客 将 木马 打包 成 一 个 叫 1s 的 文件 ， 散 布 于 网 上 。 就 算 你 将 点 放 在 命令 路 径 的 末端 ， 你 
也 可 能 因为 打 错 s1 或 ks 而 触发 意外 。 
口 可 能 产生 不 一 样 的 结果 ,， 令 人 混淆 。 当 前 目录 的 切换 可 能 会 导致 命令 相同 但 效果 不 同 。 


13.3.2 ”帮助 手册 的 路 径 


传统 的 帮助 手册 路 径 来 自 于 环境 变量 MANPATH， 但 你 不 应 该 设置 它 ， 因 为 这 样 会 重 写 了 
/etc/manpath.config 的 默认 设置 。 


13.3.3 ”提示 符 


有 经 验 的 用 户 都 不 想 看 到 兄长、 复杂 、 无 用 的 提示 符 。 相 比 之 下 , 很 多 管理 员 和 发 行 版 却 喜 
欢 将 所 有 东西 都 拖 搜 到 默认 的 提示 符 中 。 你 做 出 的 选择 应 该 迎合 用 户 的 需要 。 如 果 他 们 真 的 需要 
当前 目录 、 主 机 名 、 用 户 名 ， 则 可 以 将 它们 加 入 到 提示 符 中 。 

最 重要 的 是 ， 不 要 用 到 shell 的 关键 字 ， 例 如 : 


{}=&<> 


注解 ”要 特别 小 心 “>” 字 符 。 如 果 你 拿 shell 窗 口 的 内 容 来 复制 粘贴 ， 可 能 会 导致 你 当前 目录 中 
出 现 空 文件 ( 回忆 一 下 “>” 的 重 定向 输出 功能 )。 


其 实 默认 的 shell 提 示 符 也 不 是 很 理想 的 。 例如 , 默认 的 bash 提 示 符 包含 了 shell 名 称 和 版 本 号 。 
以 下 这 个 简单 的 bash 提 示 符 设置 以 常见 的 $ 结 尾 ( 传统 的 csh 提 示 符 则 以 % 结 尾 ): 


PS1="\u\$ 


\u 用 于 代替 当前 用 户 ( 详 见 bash(1) 帮 助手 册 的 PROMPTING 节 )。 
其 他 常用 的 替代 选项 如 下 所 示 。 
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口 \h: 主机 名 (不 含 域 名 的 短 形式 )。 

口 \!; 历史 号 。 

口 \w: 当前 目录 。 因 为 这 可 能 很 长 ， 你 可 以 用 \w 来 只 显示 当前 路 径 末 端的 目录 。 
口 $: 普通 用 户 显示 为 $，root 用 户 显示 为 #。 


13.3.4 别名 


别名 是 用 户 环境 的 难点 之 一 。 它 是 shell 的 一 种 特性 ， 能 在 执行 命令 之 前 替换 其 中 的 字符 串 ， 
可 作为 一 种 减少 打字 量 的 途径 。 但 其 实 它 也 是 有 缺点 的 ， 如 下 所 列 。 
口 它 可 以 连 参数 也 替换 掉 。 
口 它 容易 让 人 困惑 。shell 的 内 置 命令 which 可 以 告诉 你 一 个 东西 它 是 不 是 别名 ， 但 不 能 告诉 
你 哪里 定义 了 这 个 别名 。 
口 它 在 子 shell 和 非 交 互 式 shell 中 无 法 使 用 ， 只 能 在 当前 shell 中 使 用 。 
鉴于 以 上 缺点 ， 你 应 该 尽 可 能 避免 使 用 别名 ， 因 为 编写 shell 函 数 或 全 新 的 shell 脚 本 会 更 好 控 
制 。 现 代 计 算 机 都 能 快速 地 启动 和 运行 shell， 所 以 别名 与 全 新 的 命令 用 起 来 几乎 没有 差异 。 
然而 ， 当 你 仅 想 在 某 部 分 shell 环 境 中 改变 命令 意义 时 ， 可 使 用 别名 (或 函数 )。 因 为 shell 脚 
本 是 无 法 改变 环境 变量 的 ， 它 运行 于 子 shell 中 。 


13.3.5 ”权限 掩 码 


如 第 2 章 所 述 ， 你 可 以 用 shell 的 内 置 命令 umask( 权限 掩 码 ) 来 设置 默认 权限 。 你 应 该 在 某 个 
启动 文件 中 使 用 umask， 以 确保 无 论 你 用 什么 程序 来 创建 文件 ， 都 能 给 该 文件 赋予 你 需要 的 权限 。 
以 下 是 两 个 值得 参考 的 掩 码 选择 。 

口 077: 此 掩 码 最 严格 ， 它 使 得 新 建 的 文件 与 目录 只 能 由 创建 者 访问 。 在 多 用 户 的 系统 中 ， 

如 果 你 不 想 其 他 人 查看 你 的 文件 ， 那 么 是 可 以 用 这 个 的 。 然 而 ， 如 果 默 认 设 成 这 样 ， 而 
你 的 用 户 又 不 懂 怎 样 自行 修改 权限 的 话 ， 那么 他 们 在 分 享 文件 的 时 候 就 会 出 现 问题 。( 经 
验 不 足 的 用 户 可 能 会 将 文件 修改 成 所 有 人 可 写 。) 

口 022: 此 掩 码 能 让 其 他 用 户 查 看 新 建 的 文件 和 目录 的 内 容 。 这 在 单 用户 的 环境 中 也 是 有 意 

义 的 ， 因 为 很 多 守护 进程 是 以 伪 用 户 的 形式 运行 的 ， 它 们 不 能 访问 以 077 掩 码 创 建 的 文件 
和 目录 。 


注解 ” 某 些 应 用 (特别 是 邮件 应 用 ) 会 将 掩 码 重 写 成 077， 因 为 这 些 应 用 认为 由 它们 创建 的 文件 
只 应 由 创建 者 查看 。 


13.4 ”启动 文件 的 顺序 及 例子 
在 了 解 了 启动 文件 该 有 的 内 容 后 , 现在 来 看 下 具体 的 例子 。 令 人 意外 的 是 , 创建 启动 文件 的 
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难点 之 一 , 竞 是 选择 使 用 哪些 启动 文件 。 下 一 节 我 们 会 介绍 Unix shell 中 两 个 最 流行 的 做 法 : bash 
和 tcsh。 


13.4.1 bash shell 


在 bash 里 ， 有 .bash_profile 、.profile 、.bash login 和 .bashrc 等 启动 文件 名 可 供 选 择 。 那 么 到 底 
那个 适合 设置 命令 路 径 、 手 册 路 径 、 提 示 符 、 别 名 和 权限 掩 码 呢 ? 答案 就 是 : 你 应 该 使 用 .bashrc， 
并 建立 名 为 .bash_profile 的 符号 链接 指向 它 ， 因 为 bashshell 的 实例 是 有 不 同类 型 的 。 

shell 实 例 的 类 型 主要 有 两 种 : 交互 式 和 非 交 互 式 。 但 其 中 我 们 只 关心 交互 式 的 ， 因 为 非 交 互 
式 的 shell( 例如 运行 shell 脚 本 的 那些 ) 通常 不 读 取 启动 文件 。 而 交互 式 shell 则 是 从 终端 读 取 并 运 
行 命令 的 环境 ， 本 书 中 曾 提 到 过 。 它 分 为 登录 shell 和 非 登 录 shell 两 种 。 

登录 shell 

按照 传统 说 法 ， 登 录 shell 就 是 你 通过 /bin/login 之 类 的 程序 登录 系统 时 所 获得 的 shell。 用 SSH 
来 远程 登录 ， 获 取 的 也 是 登录 shell。 登 录 shell 的 基本 概念 就 是 ， 它 是 一 个 初始 shell。 可 以 用 echo 
$0 来 验证 一 个 shell 是 不 是 登录 shell， 如 果 它 打印 出 的 第 一 个 字符 是 单杠 ( - )， 那 当前 shell 就 是 登 
录 shell。 

当 bash 以 登录 shell 的 形式 运行 时 ， 它 会 运行 /etc/profile 。 然 后 就 会 寻找 用 户 的 .bash_ 
profile 、.bash_login 和 .profile 文 件 ， 并 运行 它 所 找到 的 第 一 个 文件 。 


至 


让 一 个 非 交 互 式 shell 像 登录 shell 一 样 运行 启动 文件 ， 也 是 可 以 的 ， 虽 然 听 起 来 有 点 怪 。 要 想 
这 样 做 ， 只 要 在 启动 该 shell 时 带 上 -1 或 --login 选 项 即 可 。 
非 登 录 shell 


非 登 录 shell 就 是 登录 以 后 另外 再 运行 的 shell。 即 交互 式 shell 中 ， 除 登录 shell 之 外 的 shell。 窗 口 
化 的 系统 终端 程序 ( 如 xterm、GNOME 终 端 等 ) 都 会 启动 非 登录 shell， 除 非 你 指定 它 提 供 登 录 shell。 

当 bash 以 非 登 录 shell 的 形式 启动 时 ， 它 会 运行 /etc/bash.bashrc 以 及 用 户 的 .bashrc。 

两 种 shell 所 带 来 的 影响 

之 所 以 有 两 种 shell， 是 因为 以 前 人 们 通过 终端 登录 时 使 用 的 是 登录 shell， 而 登录 后 运行 窗口 
化 程序 或 screen 程 序 的 子 shell 则 是 使 用 非 登 录 shell。 如 果 在 所 有 非 登 录 的 子 shell 中 都 运行 用 户 环 
境 的 设 定 程序 ， 那 是 很 浪费 资源 的 。 所 以 ， 你 可 以 在 登录 shell 中 运行 包含 各 种 各 样 启 动 命令 
的 .bash_profile， 而 让 非 登 录 的 .bashrc 文 件 只 包含 别名 设 定 和 其 他 “ 轻 量 ” 的 东西 。 

今 时 今日 ， 大 多 数 的 桌面 用 户 都 是 通过 图 形 界面 管理 器 (下 一 章 你 就 会 学 到 ) 登录 的 。 它 们 
大 多 数 是 以 一 个 非 交 互 式 的 登录 shell 启 动 , 以 适 配 上 述 的 登录 与 非 登录 模型 。 如 果 不 这 么 做 的 话 ， 
那 你 就 要 在 .bashrc 中 做 好 所 有 的 环境 设 定 〈 命令 路 径 、 手 册 路 径 等 等 )， 不 然 你 的 shell 终 端 窗口 
将 没有 你 的 个 人 设 定 。 如 果 你 想 通 过 控制 台 或 远程 登录 来 登录 系统 ， 那 么 你 就 还 需要 有 .bash_ 
profile， 因 为 登录 shell 是 不 会 读 取 .bashrc 的 。 

.bashrc 例 子 

为 了 同时 满足 非 登 录 和 登录 shell, 你 会 如 何 创建 一 个 能 被 当 作 .bash_profile 使 用 的 .bashrc 呢 ? 
以 下 是 一 个 初级 的 例子 ( 其 实 也 足够 完美 了 )。 
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# Command path . 
PATH=/usr/local/bin:/usr/bin:/bin:/usr/games 
PATH=$HOME/bin:$PATH 


# PS1 is the regular prompt. 

# Substitutions include: 

# \u username \h hostname \w current directory 

# \! history number \s shell name \$ $ if regular user 
PS1="'\u\$ ， 


# EDITOR and VISUAL determine the editor that programs such as less 
# and mail clients invoke when asked to edit a file. 

EDITOR=vi 

VISUAL=vi 


# PAGER is the default text file viewer for programs such as man. 
PAGER=less 


# These are some handy options for less. 

# A different style is LESS=FRX 

# (F=quit at end, R=show raw characters, X=don't use alt screen) 
LESS=meiX 


# You must export environment variables. 
export PATH EDITOR VISUAL PAGER LESS 


# By default, give other users read-only access to most new files. 
umask 022 


如 早先 提 到 的 , 你 可 以 为 .bash_profile、 指 向 .bashre 的 符号 链接 , 以 共用 .bashrc 的 内 容 ， 
或 者 直接 在 .bash_profile 中 只 一 行 : 


. $HOME/ .bashrc 


检查 是 否 是 登录 和 交互 式 shell 

当 .bashrc 与 .bash_profile 一 致 时 ,一般 不 用 再 让 登录 shell 执 行 什么 额外 的 命令 了 。 然 而 ， 如 果 
你 还 想 为 登录 和 非 登录 的 shell 定 义 不 同 的 动作 ， 那么 可 以 在 .bashrc 中 加 入 以 下 测试 ， 它 会 检查 $- 
变量 是 否 包含 i 字符 : 


洲 


case $- in 

*i*) # interactive commands go here 
command 
-- Snip-- 
;3 

*)  # non-interactive commands go here 
command 
-- Snip- 
33 

esac 
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13.4.2 tcsh shell 


实际 上 ， 所 有 Linux 系 统 标 配 的 csh 都 是 tcsh。 它 是 C shell 的 加 强 版 ， 突 出 了 命令 行 编辑 、 多 
模式 文件 名 、 命 令 补 全 等 特性 。 即 使 你 没 将 tcsh 作 为 新 用 户 的 默认 shell， 你 也 应 该 提供 tcsh 的 启 
动 文件 ， 以 防 你 遇 到 想 用 tcsh 的 人 。 

在 tcsh 中 ， 你 不 用 担心 登录 和 非 登录 的 区 别 。 它 启动 的 时 候 ， 会 先 查找 .tcshrc 文 件 ， 如 果 没 
找到 ， 就 会 去 找 csh 的 启动 文件 .cshrc。 之 所 以 按照 这 个 顺序 ， 是 因为 .tcshrc 可 以 放置 csh 不 支持 的 
命令 。 尽 管 没什么 人 会 用 csh， 但 你 还 是 应 该 坚持 使 用 .cshrc， 而 非 .tcshrc。 如 果 碰 巧遇 到 有 使 用 
csh 的 ， 那 么 幸好 .cshrc 还 能 运作 。 

.Cshrc 例 子 

以 下 是 .cshrc 的 一 个 例子 。 


# Command path . 
setenv PATH /usr/local/bin:/usr/bin:/bin:$HOME/bin 


# EDITOR and VISUAL determine the editor that programs such as less 
# and mail clients invoke when asked to edit a file. 

setenv EDITOR vi 

setenv VISUAL vi 


# PAGER is the default text file viewer for programs such as man. 
setenv PAGER less 


# These are some handy options for less. 
setenv LESS meiX 


# By default, give other users read-only access to most new files. 
Umask 022 


# Customize the prompt. 

# Substitutions include: 

# %n username %m hostname %/ current directory 
# %h history number %]1 current terminal %% % 
set prompt="%m%% " 


13.5 用户 默认 设置 


为 新 用 户 编写 启动 文件 和 选择 默认 设置 的 最 佳 方法 ， 就 是 以 新 用 户 的 身份 来 试用 一 个 系统 。 
即 新 建 测 试 账 号 ， 并 赋予 其 空 的 home 目 录 ， 从 头 开 始 写 启 动 文件 ， 而 非 复 制 你 home 目 录 的 启动 
文件 。 

当 你 认为 你 写 好 的 时 候 ， 就 用 测试 账号 以 各 种 方式 (控制 台 、 远 程 等 ) 登录 。 确保 自己 测试 
到 尽 可 能 多 的 内 容 , 包括 窗口 化 系统 操作 和 帮助 手册 查阅 。 当 你 觉得 操作 顺畅 时 ， 就 创建 另 一 个 
测试 账号 ,并 从 之 前 的 测试 账号 那里 复制 启动 文件 。 如 果 依 然 可 行 , 那么 你 这 套 新 的 启动 文件 就 
可 以 发 布 使 用 了 。 
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接 下 来 的 部 分 概述 了 一 些 可 作 参 考 的 新 用 户 默认 设置 。 
13.5.1 ”shell 默 认 设 置 


Linux 上 的 默认 shell 应 该 是 pash， 因 为 : 
口 人 们 惯用 bash 环 境 来 编写 脚本 (csh 不 适合 写 脚 本 )， 所 以 交互 式 环境 也 该 用 bash; 
口 Linux 标 配 bash; 
口 bash 用 到 了 GNU readline， 因 此 它 的 接口 与 其 他 工具 是 相同 的 ; 
口 bash 的 1/O 重 定向 和 文件 操作 很 易 上 手 。 
然而 ， 有 很 多 Unix 老 手 是 只 用 csh 和 tcsh 的 ， 因 为 他 们 不 想 改 变 习 惯 。 当 然 ， 你 也 可 以 按 自 
己 喜 好 来 选择 用 哪 种 shell。 如 果 没 有 特殊 喜好 , 那 就 用 pash, 并 把 新 用 户 的 默认 shell 设 置 为 bash。 
(用 户 可 以 用 chsh 命 令 来 切换 到 自己 喜欢 的 shell。) 


注解 ”shell 的 种 类 还 有 很 多 (rc、ksh、zsh、es 等 ) 有些 是 不 适合 新 手 的 ， 但 zsh 和 fish 是 比较 
受 新 用 户 欢迎 的 两 个 替代 选择 。 


13.5.2 ”编辑 器 


按照 传统 ， 默 认 编 辑 器 是 vi 或 emacs。Unix 系 统 中 一 般 都 有 它们 的 存在 ， 且 这 么 常见 就 意味 
着 它们 是 没什么 问题 的 。 不 过 很 多 Linux 发 行 版 则 会 将 nano 设 定 为 默认 编辑 器 ， 因 为 它 对 于 新 手 
更 易 用 。 

但 在 启动 文件 中 ， 应 该 避免 大 量 的 编辑 器 设置 。 在 .exrc 中 写 上 set showmatch 是 没有 坏处 的 ， 
但 最 好 别 写 上 showmode 、 自 动 缩 进 或 右边 距 之 类 能 明显 改变 编辑 器 行为 或 外 观 的 设置 。 


13.5.3” 翻 页 器 


PAGER 环 境 变 量 设 为 less 是 不 会 有 错 的 。 


13.6 ”局 动 文件 的 一 些 陷 阱 


在 shell 局 动 文 件 中 ， 务 必 注 意 以 下 事项 : 

口 不 要 在 启动 文件 中 放置 任何 图 形 命令 ; 

口 不 要 在 启动 文件 中 设置 环境 变量 DISPLAY; 

口 不 要 在 启动 文件 中 设置 终端 类 型 ，; 

口 不 要 在 启动 文件 中 音 亩 于 注释 ; 

口 不 要 在 启动 文件 中 打印 东西 到 标准 输出 ; 

口 不 要 在 启动 文件 中 设置 LD_LIBRARY_PATH( 详 见 15.1.4 节 )。 
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13.7 ”前瞻 


因为 本 书 只 讲解 Linux 底 层 ， 所 以 不 会 涉及 窗口 环境 的 启动 文件 。 那 当然 是 一 个 很 大 的 话题 ， 
因为 供 你 登录 用 的 显示 管理 器 也 有 自己 的 一 套 启 动 文件 ， 诸 如 .xsession 、.xinittre， 以 及 无 尽 的 
GNOME 和 KDE 相 关 的 项 目 组 合 。 

选择 窗口 启动 文件 看 起 来 令 人 眼花 综 乱 ， 而 且 没 有 通用 标准 。 下 一 章 就 会 讲 到 各 种 可 能 性 。 
当 你 决定 好 系统 的 用 途 时 , 你 可 能 会 大 动 那 些 图 形 相关 的 环境 设 定 。 这 无 所 谓 , 但 千 万 别 把 改动 
套 到 新 用 户 身 上 。“ 保 持 简 单 ” 这 一 宗旨 不 仅 适用 于 shell 启 动 文件 , 也 适用 于 GUI 启 动 文件 。 事实 
上 ， 你 甚至 可 能 完全 不 需要 修改 GUI 启动 文件 。 
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Linux 桌 面 概览 


本 章 会 简单 介绍 一 些 Linux 桌 面 系统 中 的 常见 组 件 。 
Linux 的 各 种 应 用 之 中 ， 桌 面 应 该 算是 最 丰富 多 彩 的 一 种 ， 
因为 它 选择 众多 , 而 大 多 数 发 行 版 也 一 般 都 会 提供 桌面 系统 
供用 户 使 用 。 


跟 Linux 的 其 他 部 分 ( 如 存储 和 网 络 ) 不 同 ， 桌面 结构 没有 太 多 层级 。 桌 面 的 每 个 组 件 都 只 
对 应 特定 的 任务 , 只 在 必要 时 才 与 其 他 组 件 沟通 ,有 些 组 件 会 共享 通用 的 库 ( 特别 是 图 形 工具 库 )， 
你 可 以 把 它 看 作 抽象 的 层次 ， 也 就 是 它 所 能 到 达 的 深度 。 

大 臻 上， 本 章 宏观 地 讨论 各 个 桌面 组 件 ， 其 中 两 个 会 讲 得 比较 细 : X Window 系 统 ( 它 是 大 
多 数 桌面 的 核心 设施 )， 以 及 D-Bus (一 种 应 用 于 系统 各 部 分 的 进程 间 通 信服 务 )。 动 手 实践 也 只 
限于 一 些 诊断 工具 , 虽然 它们 不 常用 到 ( 因为 大 部 分 GUI 是 不 需要 用 shell 命 令 来 交互 的 ), 但 会 帮 
助 你 了 解 系 统 的 底层 机 制 ， 或 许 还 能 在 探索 的 路 上 为 你 提供 一 些 乐趣 。 我 们 还 会 简单 讲 讲 打印 。 


14.1 桌面 组 件 


Linux 桌 面 配 置 有 很 大 的 灵活 性 。 用 户 体验 (桌面 的 外 观 及 给 人 的 感觉 ) 基本 来 自 各 种 应 用 
或 应 用 中 的 组 件 。 如 果 你 不 喜欢 某 个 应 用 ， 你 可 以 找 个 替代 品 。 如 果 找 不 到 ， 你 还 可 以 自己 写 一 
个 。Linux 开 发 者 往往 有 不 同 喜好 ， 这 使 得 开发 出 来 的 产品 有 很 多 花样 。 

为 了 能 协同 工作 ， 各 种 应 用 就 需要 有 一 些 共性 ， 而 在 几乎 所 有 的 Linux 桌 面 组 件 中 ， 这 种 共 
性 就 是 X 服 务 器 ( 即 X Window 系 统 服务 器 )。 你 可 以 把 它 想 象 为 桌面 的 “内 核 ”, 管理 着 窗口 功能 
和 显示 配置 ， 并 处 理 来 自 键盘 和 鼠标 等 设备 的 输入 。 它 是 难以 取代 的 〈 详 见 14.4 节 )。 

X 服 务 需 只 是 一 个 服务 器 ， 它 无 法 决定 桌面 的 表现 形式 。 相 反 ， 用 户 界 面 是 由 X 客 户 端 处 理 
的 。 基 本 的 X 客 户 端 应 用 如 终端 窗口 和 网 页 浏览 咒 ， 会 连接 到 X 服 务 器 ， 并 请 求 它 绘制 窗口 。 这 
样 X 服 务 右 就 会 算出 窗口 的 位 置 并 在 该 位 置 提 供 图 形 。X 服 务 右 也 会 在 适当 的 时 候 将 用 户 输入 反 
馈 给 客户 问 。 
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14.1.1 窗口 管理 器 


X 客 户 端 不 一 定 是 窗口 化 的 应 用 ， 它 可 以 是 其 他 客户 端的 服务 供应 者 ， 或 者 提供 接口 功能 。 
而 窗口 管理 器 或 许 是 最 重要 的 服务 于 客户 端的 应 用 , 因为 它 负责 窗口 的 位 置 安排 , 以 及 提供 一 些 
交互 式 装饰 ( 例如 用 于 窗口 移动 、 缩 放 的 标题 栏 )。 这 些 都 是 用 户 体验 的 核心 。 

窗口 管理 器 的 实现 有 很 多 种 。 像 Mutter/GNOME Shell 和 Compiz 之 类 基本 上 是 独立 的 窗口 管理 
器 ， 而 Xfce 之 类 则 是 内 置 于 整个 环境 中 的 。 大 部 分 窗口 管理 器 的 目标 都 是 方便 用 户 使 用 。 有 一 些 
是 为 了 实现 特别 的 视觉 效果 ,或 者 只 为 提供 极 简 的 界面 。 窗 口 管理 需 一 般 是 不 会 有 标准 的 ， 因 为 
用 户 的 品味 和 需求 多 种 多 样 ， 而 且 经 常 变化 ， 所 以 也 经 常 诞生 新 的 窗口 管理 器 。 


14.1.2 工具 包 


桌面 应 用 都 有 一 些 相似 的 元 素 , 例如 按钮 、 菜 单 , 这 些 都 叫 部 件 。 为 了 加 快 应 用 开发 的 速度 ， 
以 及 提供 一 个 符合 人 们 习惯 的 界面 ， 程 序 员 们 都 会 使 用 图 形 工具 包 来 制作 这 些 元 素 。 在 Windows 
或 Mac OS X 这 类 操作 系统 中 ， 供 应 商会 提供 一 套 通用 的 工具 包 ， 大 多 数 程序 员 都 会 使 用 到 。 而 
Linux 最 常用 的 则 是 GTK+ 工 具 包 。 除 此 之 外 ，Qt 框 架 等 其 他 工具 也 不 少见 。 

工具 包 一 般 会 包含 共享 库 和 支持 文件 ， 如 图 像 和 主题 信息 。 


14.1.3 ”桌面 环境 


尽管 工具 包 能 提供 统一 的 外 观 , 但 有 些 桌面 的 细节 还 是 需要 不 同 应 用 进行 某 种 程度 的 协作 才 
能 表现 的 。 比 如 说 , 你 可 能 想 让 某 个 应 用 与 另 一 个 应 用 共享 数据 , 或 者 刷新 桌面 上 共用 的 通知 栏 。 
若 要 满足 这 一 需要 ,可 以 将 工具 包 和 其 他 库 绑 在 一 起 , 放 到 一 个 叫 作 桌 面 环境 的 大 包 中 ,GNOME、 
KDE、Unity 和 Xfce 都 是 常见 的 Linux 桌 面 环境 。 

工具 包 在 多 数 桌 面 环境 中 都 处 在 核心 位 置 , 但 要 创建 一 个 统一 的 桌面 , 环境 还 必须 具备 各 种 
支持 文件 , 例如 图 标 和 配置 所 构成 的 主题 。 所 有 这 些 都 要 被 描述 设计 协议 ( 如 应 用 菜单 和 标题 如 
何 呈 现 、 应 用 对 某 些 系统 事件 要 做 什么 反应 等 ) 的 文档 捆绑 在 一 起 。 


14.1.4 ”应 用 


桌面 的 顶端 就 是 各 种 应 用 了 ， 诸 如 网 页 浏览 器 、 终 端 窗口 等 。 原 始 如 xclock 程 序 ， 复杂 如 
Chrome 浏 览 器 和 LibreOffice 套 件 ， 都 是 X 应 用 。 一 般 情 况 下 它们 是 独立 工作 的 ， 但 其 实 它们 也 会 
使 用 进程 间 通 信 来 响应 与 它们 有 关 的 事件 。 例如 , 一些 应 用 会 对 以 下 情况 做 出 反应 : 挂 载 了 新 的 
存储 设备 、 收 到 新 邮件 或 即时 信息 。 这 些 通信 一 般 发 生 在 D-Bus 上 ， 我 们 会 在 14.5 节 讲 到 。 


14.2” 近 观 X Window 系统 


X Window 系 统 ( http://www.x.org/ ) 历来 就 很 庞大 ,， 它 基础 的 发 行 版 包括 了 X 服 务 右 、 客 户 端 
支持 库 和 各 种 客户 端 。 因 为 GNOME 和 KDE 等 桌面 环境 的 出 现 ，X 发 行 版 的 角色 也 一 直 在 变换 。 
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现在 它 的 关注 点 主要 在 核心 服务 器 〈 即 管理 泻 染 和 输入 设备 的 部 分 ) 和 简化 的 客户 端 库 。 
X 服 务 咒 的 运行 不 难 识别 。 它 就 叫 X。 看 看 进程 列表 ， 你 通常 会 发 现 它 以 这 些 选项 运行 着 : 


/usr/bin/X :0 -auth /var/run/lightdm/root/:0 -nolisten tcp vt7 -novtswitch 


这 里 的 :0 被 称 为 显示 接口 ， 是 一 个 标识 ,代表 着 一 个 或 多 个 用 键盘 和 (或 ) 鼠标 访问 的 显示 
器 。 通 常 ， 显 示 接 口 只 与 单个 显示 器 对 应 ， 但 你 也 可 以 将 多 个 显示 器 放 到 一 个 显示 接口 上 。 使 用 
X 会 话 时 ， 环 境 变量 DISPLAY 包 含 了 显示 接口 的 标识 。 


注解 ”显示 接口 可 以 细 分 为 多 个 屏幕 ， 例 如 :0.0 和 :0.1， 但 这 种 做 法 越 来 越 少见 了 ， 因 为 X 扩 展 
( 如 RandR ) 能 将 多 个 显示 器 合并 成 一 个 大 的 虚拟 屏幕 。 


Linux 的 X 服 务 器 是 运行 在 虚拟 终端 的 。 上 例 的 vt7 参 数 表 明了 它 运行 在 /dev/tty7 之 上 。( 一 般 
服务 器 会 优先 选择 第 一 个 可 用 的 虚拟 终端 。) 你 可 以 在 不 同 的 虚拟 终端 上 同时 运行 不 同 的 X 服 务 
器 ， 这 样 每 个 服务 器 都 会 需要 一 个 各 自 独立 的 显示 接口 标识 。 你 可 以 用 CTRL-ALTFN 键 或 chvt 
命令 在 不 同 服务 器 之 间 切 换 。 


14.2.1 显示 管理 器 


一 般 你 是 不 会 从 命令 行 启动 X 服 务 器 的 ， 因 为 这 么 做 不 会 启动 任何 客户 端 来 连接 到 这 个 服务 
器 ， 结 果 只 会 得 到 一 个 空白 的 屏幕 。 相 反 ， 通 常 的 做 法 是 用 显示 管理 器 来 启动 X 服 务 器 ， 它 会 在 
屏幕 上 放置 一 个 登录 框 。 当 你 登录 之 后 , 显示 管理 器 就 会 启动 一 系列 的 客户 端 诸如 窗口 管理 器 和 
文件 管理 器 ， 以 便 你 使 用 机 器 。 
显示 管理 器 有 很 多 种 ， 例 如 gdm ( 用 于 GNOME ) 和 kdm ( 用 于 KDE )。 上 例 中 的 lightdm 是 一 
个 跨 平 台 的 显示 管理 器 ， 它 能 打开 GNOME 和 KDE 会 话 。 

若 想 从 虚拟 控制 台 而 非 显示 管理 器 开启 X 会 话 ， 你 可 以 运行 startx 或 xinit 人 命令。 然而, 这样 
获取 的 会 话 相 当 简 单 ， 与 显示 管理 器 的 会 话 完全 不 同 ， 因 为 它们 的 机 制 以 及 启动 文件 都 不 同 。 


14.2.2 ”网 络 透明 性 


X 还 有 一 个 特性 就 是 其 网 络 透明 性 。 因 为 客户 端 跟 服务 器 的 沟通 是 遵循 协议 的 ， 所 以 我 们 可 
以 让 服务 器 监听 6000 端 口 的 TCP 连 接 。 也 就 是 说 ， 可 以 通过 网 络 来 连接 不 同 机 器 上 的 客户 端 和 服 
务 器 。 客 户 端 只 需 通 过 验证 ， 就 可 将 窗口 信息 发 送 给 服务 器 。 

不 幸 的 是 ,这 个 方法 是 没有 加 密 的 ， 所 以 并 不 安全 。 为 了 填补 这 个 漏洞 ， 大 多 数 发 行 版 都 会 
关闭 X 服 务 器 的 网 络 监听 器 ( 如 上 例 的 --nolisten tcp 选 项 )。 不过， 如 第 10 章 提 到 的 ， 你 还 是 可 
以 通过 SSH 管 道 ， 使 用 Unix 域 套 接 字 让 X 客 户 端 远程 连接 X 服 务 器 。 
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WE 1 


14.3 探索 X 客户 端 

虽然 一 般 人 不 会 从 命令 行 的 角度 来 思考 GUI 的 运作 ， 但 还 是 有 一 些 工 具 这 么 做 。 借 助 它们 ， 
你 可 以 监控 客户 端的 运行 。 

xwininfo 是 最 简单 的 工具 之 一 。 不 带 参数 运行 它 的 话 ， 它 会 要 你 点 选 一 个 窗口 : 


$ xwininfo 

xwininfo: Please select the window about which you 
would like information by clicking the 
mouse in that window. 


选 完 之 后 ， 它 就 会 打印 出 该 窗口 的 信息 列表 ， 如 位 置 和 尺寸 : 


xwininfo: Window id: Ox5400024 "xterm" 


Absolute upper-left X: 1075 
Absolute upper-left Y: 594 
-- Snip-- 


注意 这 里 的 窗口 ID ， 它 是 X 服 务 器 和 窗口 管理 器 用 来 识别 窗口 的 标识 。xl1sclients -1 命令 可 
打印 出 所 有 窗口 ID 的 客户 端 。 


注解 ”有 一 种 特别 的 窗口 ， 叫 root 窗 口 ， 是 画面 的 背景 。 然 而 ， 你 一 般 是 不 会 看 到 它 的 ( 详 见 
14.3.2 节 )。 


14.3.1 X 事 件 


X 客 户 端 通过 事件 系统 获取 输入 和 服务 器 状态 等 信息 。X 事 件 的 工作 方式 类 似 于 其 他 异步 进 
程 间 通信 ( 如 udev 事 件 和 D-Bus 事 件 ): X 服 务 器 从 输入 设备 等 源头 获取 信息 ， 再 将 它们 当 作 事 件 
重新 分 发 给 感 兴趣 的 X 客 户 端 。 

你 可 以 通过 运行 xev 命 令 来 体验 什么 叫 作 事件 。 运 行 xev， 就 会 打开 一 个 可 以 打字 、 点 击 和 使 
用 鼠标 的 窗口 。 根 据 你 的 操作 ，xev 就 会 输出 X 服 务 需 接收 到 的 事件 的 描述 。 以 下 是 一 个 鼠标 事件 
的 输出 例子 : 


$ xev 

-- Snip-- 

MotionNotify event, serial 36, synthetic NO, window 0x6800001， 
root Oxbb, subw Ox0, time 43937883, (47,174), root:(1692,486), 
state Ox0, is hint 0, same screen YES 


MotionNotify event, serial 36, synthetic NO, window Ox6800001, 
root Oxbb, subw Ox0, time 43937891, (43,177), root:(1688,489), 
state Ox0, is hint 0, same screen YES 
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注意 括号 中 的 坐标 。 第 一 个 坐标 代表 了 窗口 中 鼠标 的 位 置 ， 而 第 二 个 ( root: ) 则 是 鼠标 在 
整个 屏幕 中 的 位 置 。 

其 他 低层 次 的 事件 还 包括 键盘 襄 击 和 按钮 点 击 , 而 鼠标 进入 或 离开 窗口 、 窗 口 获 得 或 失去 窗 
口 管理 器 的 关注 则 属于 高 级 事件 。 以 下 就 是 对 应 的 离开 事件 和 失去 关注 事件 : 


LeaveNotify event, serial 36, synthetic NO, window 0x6800001， 
root Oxbb, subw Ox0, time 44348653, (55,185), root:(1679,420), 
mode NotifyNormal, detail NotifyNonlinear, same screen YES, 
focus YES, state 0 


FocusOut event, serial 36, synthetic NO, window Ox6800001, 
mode NotifyNormal, detail NotifyNonlinear 


xev 的 一 个 常见 用 法 是 从 不 同 的 键盘 抽取 键 码 和 键 标志 , 并 对 它们 重新 映射 。 以 下 是 敲 击 L 键 
的 输出 情况 ， 其 键 码 是 46: 


KeyPress event, serial 32, synthetic NO, window Ox4c00001, 
root Oxbb, subw Ox0, time 2084270084, (131,120), root:(197,172), 
state Ox0, keycode 46 (keysym Ox6c, 1), same screen YES, 
XLookupString gives 1 bytes: (6c) "1" 
XmbLookupString gives 1 bytes: (6c) "1" 
XFilterEvent returns: False 


你 还 可 以 加 上 -id id (其 中 id 是 xwininfo 输 出 的 ID ) 选项 ， 让 xev 与 某 个 现 有 的 窗口 ID 关联 ， 
或 者 用 -root 选项 监视 root 窗 口 。 


14.3.2 ”理解 X 输入 以 及 偏好 设 定 


X 最 让 人 困惑 的 地 方 或 许 是 它 提供 多 种 途径 设 定 偏 好 ， 但 不 是 所 有 的 都 可 行 。 例 如 ， 有 种 常 
见 的 键盘 偏好 是 将 Caps Lock 键 映射 到 Control 键 。 它 的 实现 方法 有 很 多 种 ， 可 用 古老 的 xmodmap 命 
令 进 行 微小 的 调整 ， 也 可 用 setxkbmap 工 具 进行 完 全 的 重 映 射 。 但 你 怎么 知道 该 用 哪个 呢 ? 你 需 
要 知道 系统 的 哪 一 块 负责 这 个 问题 , 但 这 有 些 困难 。 不 过 至 少 要 记 住 , 桌面 环境 是 可 以 有 自己 的 
设 定 以 及 重 写 的 。 

总 结 起 来 ， 底 层 设 施 有 以 下 几 点 是 需要 关注 的 。 

输入 设备 〈 通 用 ) 

X 服 务 右 使 用 X 输 入 扩展 来 管理 各 种 不 同 设备 的 输入 。 基 本 的 输入 设备 有 两 种 一 一 键盘 和 指 
针 ( 鼠标 ) 一 一 其 实 你 可 以 想 用 多 少 设 备 就 用 多 少 。 为 了 做 到 同时 使 用 多 个 同 种 设备 ，X 输 入 扩 
展会 创建 一 个 “虚拟 核心 ”设备 ， 用 于 将 输入 汇集 到 X 服 务 器 。 这 个 虚拟 核心 设备 就 被 称 为 主机 
( master )， 各 种 接 入 到 机 器 的 物理 设备 就 被 称 为 从 机 slave )。 

查看 机 右上 的 设备 配置 ， 可 用 xinput --1ist 命 令 : 
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$ xinput --list 
Virtual core pointer id=2 [master pointer (3)] 
Virtual core XTEST pointer id=4 [slave pointer (2)] 
Logitech Unifying Device id=8 [slave pointer (2)] 
Virtual core keyboard id=3 [master keyboard (2)] 
Virtual core XTEST keyboard id=5 [slave keyboard (3)] 
Power Button id=6 [slave keyboard (3)] 
Power Button id=7 [slave keyboard (3)] 
Cypress USB Keyboard id=9 [slave keyboard (3)] 


每 个 设备 都 有 一 个 ID ， 可 用 于 xinput 和 其 他 命令 。 上 例 中 2 和 3 这 两 个 ID 属于 核心 设备 ， 而 8 
和 9 则 是 真实 设备 。 注 意 ， 电 源 键 也 是 X 输 入 设备 。 

大 多 数 X 客 户 端 只 会 监听 核心 设备 的 输入 ， 而 对 其 他 具体 设备 发 起 的 事件 却 漠不关心 。 事 实 
上 ， 大 多 数 客 户 端 完全 不 知道 X 输 入 扩展 的 存在 。 不 过 ， 客 户 端 其 实 可 以 通过 输入 扩展 来 识别 出 
某 个 具体 设备 。 

每 个 设备 都 有 自己 的 属性 。 使 用 xinput 时 带 上 设备 的 号 码 ， 就 可 查看 其 属性 ， 如 下 所 示 。 


hl 


$ xinput --list-props 8 
Device 'Logitech Unifying Device. Wireless PID:4026': 

Device Enabled (126): 1 

Coordinate Transformation Matrix (128): 1.000000, 0.000000,0.000000, 
0.000000，1.000000，0.000000，0.000000，0.000000，1.000000 


Device Accel Profile (256) : 0 
Device Accel Constant Deceleration (257) : 1.000000 
Device Accel Adaptive Deceleration (258): 1.000000 
Device Accel Velocity Scaling (259): 10.000000 

-- Snip-- 


如 你 所 见 ， 它 能 打印 出 一 些 有 趣 的 属性 ， 这 些 属性 都 能 使 用 --set-prop 选 项 来 更 改 ( 详 见 
xinput(1) 帮 助手 册 )。 

鼠标 

你 可 以 用 xinput 命 令 修改 设备 相关 的 属性 ， 其 中 最 有 用 的 就 是 鼠标 ( 指针 )。 很 多 设置 都 可 
以 通过 直接 修改 属性 来 做 到 ， 但 其 实 还 有 更 简单 的 方法 ， 就 是 使 用 xinput 的 --set-ptr-feedback 
和 --set-button-map 选 项 。 例如 你 有 一 个 三 键 的 鼠标 dev, 你 想 改 变 其 按钮 的 操作 顺序 ( 这 比较 适 
合 惯用 左手 的 用 户 )， 那 可 以 试 试 以 下 命令 : 


ee 


$ xinput --set-button-map dev 3 2 1 


键盘 
键盘 布局 的 多 样 化 使 得 我 们 无 法 将 所 有 布局 都 整合 到 X 中 。 所 以 它 的 协议 中 内 置 了 键盘 映射 
的 功能 ， 让 你 可 以 通过 xmodmap 命 令 来 定义 布局 。 但 为 了 更 方便 操控 ， 大 部 分 现代 系统 其 实 也 都 
是 用 XKB (X 键 盘 扩 展 ) 的 。 

XKB 很 复杂 ， 所 以 很 多 人 为 了 顺手 还 是 使 用 xmodmap。XKB 的 基本 思想 是 让 你 定义 一 个 键盘 
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映射 ， 然 后 用 xkbcomp 命 令 将 它 编 译 ， 最 后 用 setxkbmap 命 令 将 它 载 和 人 到 XX 服务 器 中 并 激活 使 用 。 
该 系统 有 以 下 两 个 特别 有 趣 的 特性 。 
口 你 可 以 只 定义 一 部 分 ， 以 补充 现存 的 映射 。 这 种 做 法 有 助 于 将 Caps Lock 键 变 成 Control 刍 
之 类 的 任务 ,很 多 桌面 环境 中 的 图 形 化 的 键盘 偏好 工具 都 是 这 么 做 的 。 
口 你 可 以 为 各 个 接 入 的 键盘 定义 各 自 的 映射 。 
桌面 背景 
X 有 个 旧 的 命令 xsetroot, 它 可 以 让 你 设置 root 窗 口 的 背景 色 和 其 他 属性 , 但 在 大 多 数 机 器 上 
它 并 不 可 行 ， 因 为 root 窗 口 是 不 可 见 的 。 相 反 ， 大 部 分 桌面 环境 却 会 将 一 个 大 窗口 放置 在 其 他 所 
有 窗口 的 背后 ， 以 在 其 中 实现 “动态 壁纸 ”或 桌面 文件 浏览 的 功能 。 通 过 命令 行 更 换 背 景 的 方法 有 
很 多 ( 例如 某 些 GNOME 的 gsettings 命 令 )， 但 真 做 起 来 是 很 费时 间 的 。 
xset 
最 古老 的 偏好 设 定 命令 或 许 是 xset。 它 已 经 很 少 用 了 ， 但 xset q 命 令 确实 能 快速 显示 出 一 些 
功能 的 状态 。 也 许 其 中 最 有 用 的 选项 是 关于 屏幕 保护 和 显示 器 电源 信号 管理 (Display Power 
Management Signaling， 以 下 简称 DPMS ) 的 设 定 。 


14.4 X 的 未 来 


在 以 上 小 节 的 阅读 过 程 中 , 也 许 你 会 觉得 X 是 个 很 老 的 系统 , 它 被 改 来 改 去 以 适应 新 的 需求 。 
其 实 它 并 不 是 很 古老 。X 系 统 首创 于 20 世 纪 80 年 代 ， 尽 管 在 这 些 年 里 的 变化 非常 大 ( 它 原本 的 设 
计 就 很 注重 灵活 性 )， 但 它 未 来 不 会 有 太 大 变化 了 。 

X 的 发 展 有 个 很 明显 的 迹象 ， 即 它 的 服务 器 支持 了 极 多 的 库 ， 其 中 很 多 是 为 了 向 下 兼容 。 但 
更 明显 的 是 , 用 服务 器 管理 客户 端 、 客 户 端的 窗口 ， 并 作为 它们 与 内 存 的 中 介 ， 这 种 做 法 对 性 能 
有 很 大 影响 。 更 高 效 的 做 法 是 用 一 种 轻 量 的 组 合 窗口 管理 器 来 管理 窗口 ,并 只 对 显存 做 少量 控制 ， 
且 允 许 应 用 自行 在 显存 中 泻 染 窗口 的 内 容 。 

Wayland 是 基于 这 种 做 法 的 新 标准 ， 它 已 经 开始 引 人 注 目 。 它 最 突出 的 部 分 是 客户 端 与 组 合 
窗口 管理 器 的 沟通 协议 。 另 外 ， 它 还 定义 了 输入 设备 管理 和 X 兼 容 系统 。Wayland 协 议 同样 支持 
网 络 透明 性 。 现 在 Linux 桌 面 组 件 如 GNOME 和 KDE 都 支持 Wayland。 

但 X 的 蔡 代 者 不 止 Wayland 一 个 ， 还 有 Mir， 不 过 它 的 实现 跟 Wayland 有 点 不 同 。 某 种 程度 上 
来 说 ， 肯 定 会 有 至 少 一 种 系统 成 为 主流 ， 它 可 能 在 Wayland 和 Mir 之 中 ， 也 可 能 不 在 。 

这 些 新 产品 之 所 以 出 名 ， 是 因为 它们 不 只 用 于 Linux 桌 面 。X Window 系 统 的 低 效 使 其 不 适合 
平板 电脑 和 智能 手机 ， 于 是 制造 商用 其 他 实现 来 驱动 Linux 谍 入 式 显示 器 。 只 不 过 ， 标 准 化 的 直 
接 演 染 更 具 成 本 效益 。 


14.5 D-Bus 


D-Bus ( 即 桌 面 总 线 ) 是 Linux 桌 面 系统 的 最 重要 的 产物 之 一 , 它 是 一 个 消息 传递 系统 。D-Bus 
之 所 以 重要 ,是 因为 它 作 为 一 种 进程 间 通 信 的 机 制 ,使 得 各 种 桌面 应 用 能 够 相互 沟通 。 同 时 ,办 
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多 数 的 Linux 系 统 都 是 用 它 来 把 系统 事件 ( 例如 插入 USB 设 备 ) 通知 给 进程 的 。 
D-Bus 本 身 包含 有 支持 任何 两 个 进程 相互 沟通 的 库 ， 其 中 定义 了 规范 进程 间 通 信 的 协议 。 该 
库 其 实 只 是 一 种 进程 间 通 信 方 式 ， 就 像 Unix 域 套 接 字 。 它 的 重点 是 一 个 叫 dbus-daemon 的 “中 央 


模 ”。 需 要 对 某 些 事件 做 出 反应 的 进程 ， 可 以 到 dbus-deamon 上 注册 ， 然 后 就 能 收 到 想 要 的 事件 通 
知 了 。 当 然 ， 进 程 也 可 以 创建 事件 。 例 如 ，udisks-daemon 进 程 从 ubus 监 听 人 硬盘 事件 ， 并 发 送 到 


dbus-deamon， 而 dbus-deamon 会 把 这 些 事 件 再 转发 给 那些 对 硬盘 事件 感 兴趣 的 应 用 。 


14.5.1 ”系统 和 会 话 实例 


D-Bus 在 Linux 中 正 变 得 越 来 越 重要 ， 而 且 它 的 用 途 不 只 在 桌面 。systemd 和 Upstart 也 使 用 它 
来 通信 。 然 而 ， 在 核心 系统 中 加 入 对 桌面 工具 的 依赖 ， 这 有 违 Linux 的 设计 守则。 

为 了 解决 这 个 问题 ， 我 们 将 dbus-daemon 实 例 ( 进程 ) 分 为 两 种 。 一 种 叫 系 统 实例 ， 它 在 开 
机 时 由 init 启 动 ， 并 带 上 --system 选 项 。 这 种 实例 通常 作为 D-Bus 用 户 来 运行 ， 它 的 配置 文件 是 
/etc/dbus-l/system.conf ( 一般 你 不 应 该 修改 这 个 文件 )。 进 程 可 以 通过 /var/run/dbus/system_ 
bus_socket 的 Unix 域 套 接 字 连 接 到 该 实例 。 

男 一 种 叫 会 话 实例 。 与 系统 实例 不 同 的 是 , 会 话 实例 只 在 你 打开 桌面 会 话 时 才 会 运行 。 你 运 
行 的 桌面 应 用 会 连接 这 种 实例 。 


14.5.2 监视 D-Bus 消息 


查看 系统 实例 与 会 话 实例 区 别 的 最 佳 方 法 之 一 是 监视 总 线 上 的 消息 。 试 试 使 用 dbus-monitor 
的 system 模 式 : 


$ dbus-monitor --system 

signal sender=org.freedesktop.DBus -> dest=:1.952 serial=2 path=/org/ 

freedesktop/DBus; interface=org.freedesktop.DBus; member=NameAcquired 
string ":1.952" 


以 上 启动 信息 说 明了 该 监视 带 已 连接 ,并 获得 了 一 个 名 字 。 这 样 运行 的 话 , 能 看 见 的 信息 并 
不 多 ， 因 为 系统 实例 一 般 不 太 繁 忙 。 想 多 看 点 信息 的 话 ， 插 入 一 个 USB 存 储 设备 试 试 。 
相 比 之 下 ， 会 话 实例 就 比较 忙 了 。 假 设 你 登录 了 一 个 桌面 会 话 ， 然 后 运行 以 下 命令 : 


$ dbus-monitor --session 


接 下 来 在 不 同窗 口上 点 击 鼠 标 。 如 果 你 桌面 用 到 了 D-Bus， 你 会 看 到 有 大 量 的 信息 输出 ， 显 
示 了 那些 被 激活 的 窗口 。 


14.6 打印 
在 Linux 上 打印 文档 是 一 个 多 步 的 过 程 ， 其 步 又 如 下 所 示 。 
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(1) 打印 程序 通常 会 先 将 文档 转 成 PostScript 格 式 。 不 过 也 可 以 不 这 么 做 。 

(2) 程序 将 文档 发 给 打印 服务 器 。 

(3) 打印 服务 器 收 到 文档 后 ， 将 其 放 到 打印 队列 中 。 

(4) 当 轮 到 该 文件 时 ， 打 印 服 务 器 会 将 其 发 送 到 打印 过 滤器 。 

(5) 如 果 发 现 该 文档 不 是 PostScript 格 式 ， 打 印 过 滤器 可 以 对 其 进行 转换 。 

(6) 如 果 目 标 打印 机 不 能 识别 PostScript, 打印 机 驱动 会 将 该 文档 转换 成 打印 机 能 识别 的 格式 。 

(7) 打印 机 驱动 可 在 文档 上 加 一 些 额外 的 指令 ， 例 如 纸 匣 和 复 件数 。 

(8) 最 后 打印 服务 器 将 文档 发 给 打印 机 。 

这 里 面 最 让 人 困扰 的 ， 就 是 要 在 PostScript 上 绕 来 绕 去 。 其 实 ，PostScript 是 一 种 编程 语言 ， 
所 以 如 果 你 用 它 来 打印 文件 ， 那 么 你 实际 上 就 是 将 一 段 程序 发 给 了 打印 机 。PostScript 是 类 Unix 
系统 中 的 打印 标准 ， 就 像 .tar 是 打包 标准 一 样 。( 现在 有 些 应 用 用 到 的 PDF 格式 ， 也 是 能 转 成 
PostScript 的 。) 

下 文中 会 更 详细 地 讲解 打印 格式 ， 现 在 先 看 看 队列 系统 。 


14.6.1 CUPS 


CUPS ( http:/www.cups.org/ ) 是 Linux 和 Mac OS X 的 标准 打印 系统 。 它 的 服务 器 守护 进程 是 
cupsd， 你 可 以 用 1pr 命 令 作为 客户 端 来 发 送 文件 给 这 个 守护 进程 。 

CUPS 有 个 突出 的 功能 是 实现 了 互联 网 打印 协议 ( Internet Print Protocol， 以 下 简称 IPP )， 使 
得 它 人 允许 客户 端 与 服务 器 端 通过 TCP 端 口 631 进 行 类 HTTP 的 事务 处 理 。 事 实 上 ， 如 果 你 系统 上 运 
行 着 CUPS， 你 就 可 以 连接 http://localhost:631/ 去 看 看 你 的 打印 配置 和 打印 任务 。 大 多 数 的 网 络 打 
印 机 和 打印 服务 器 都 支持 IPP， 就 连 Windows 也 是 。IPP 简 化 了 建立 远程 打印 机 的 任务 。 

通过 网 页 界面 来 管理 这 个 系统 可 能 不 太 可 靠 ， 因 为 它 的 默认 设置 不 太 安全 。 作 为 替代 方案 ， 
发 行 版 中 通常 自 带 了 图 形 界 面 工具 以 便 你 添加 和 更 改 打印 机 。 这 些 工 具 会 修改 配置 文件 , 它们 一 
般 位 于 /ets/cups 中 。 因 为 配置 文件 可 能 比较 复杂 ， 所 以 最 好 还 是 用 工具 来 处 理 。 在 出 现 问 题 的 时 
候 ， 用 图 形 工 具 来 新 建 打印 机 也 是 不 错 的 做 法 。 


14.6.2 ”格式 转换 与 打印 过 滤器 


很 多 打印 机 ， 包 括 几乎 所 有 低 端 型 号 的 ， 都 无 法 识别 PostScript 或 PDF。 为 使 Linux 文 持 这 些 
打印 机 ， 我 们 必须 将 文档 转换 成 它们 能 识别 的 格式 。CUPS 把 文档 送 给 RIP〈 即 光栅 图 像 处 理 器 ) 
以 生成 位 图 。 而 RIP 几 乎 总 是 使 用 Ghostscript ( gs ) 程序 来 实现 这 个 过 程 。 但 是 , 要 让 生成 的 位 图 
能 适应 打印 机 的 格式 ， 还 是 有 点 麻烦 的 。 所 以 ，CUPS 使 用 的 打印 机 驱动 会 参考 特定 打印 机 的 
PostScript 打 印 机 定义 ( PostScript Printer Definition， 以 下 简称 PPD ) 文件 ， 以 解决 分 辩 率 和 纸张 
大 小 之 类 的 问题 。 
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14.7 ”其 他 有 天 果 面 的 话题 


Linux 桌 面 系统 的 趣味 性 之 一 就 在 于 它 有 很 多 项 目 供 你 选择 。 想 了 解 不 同 的 桌面 项 目 ， 可 参 
考 http://www.freedesktop.org/ 提 供 的 邮件 列表 和 项 目 链接 ,你 会 发 现 桌 面 项 目 还 有 Ayatana、Unity、 
Mir 等 等 。Linux 桌 面 还 有 一 大 产品 ， 那 就 是 Chromium OS 开源 项 目 及 其 对 应 的 Chromebook 上 的 
Google Chrome OS。 本 章 谈 到 的 很 多 桌面 技术 都 在 其 中 使 用 到 了 , 只 不 过 它 是 以 Chromium/Chrome 
网 页 浏览 器 为 核心 的 。Chrome OS 也 抛弃 了 很 多 传统 桌面 的 东西 。 
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Linux 和 Unix 在 程序 员 中 很 受 欢迎 ， 这 不 只 是 因为 它们 
工具 和 版 本 繁多 ， 而且 文档 详尽 、 相 当 透 明 。 不 是 只 有 程序 
员 才 能 使 用 Linux 的 开发 工具 ， 但 如 果 你 使 用 的 是 Linux 系 
统 , 那么 了 解 它 的 工具 还 是 有 好 处 的 。 与 其 他 操作 系统 不 同 ， 
Unix 的 管理 是 很 依赖 于 这 些 工具 的 。 至少, 你 应 该 说 得 出 它 
们 的 名 字 并 知道 怎样 运行 它们 。 


本 章 篇 幅 不 长 , 但 包含 了 大 量 的 信息 。 不 过 你 不 必 通 晓 全 部 ， 可 以 简单 浏览 一 下 ， 以 后 再 回 
过 头 来 看 。 其 中 共享 库 那 一 部 分 内 容 或 许 是 最 重要 的 。 但 要 知道 共享 库 的 来 历 ， 你 需要 先知 道 如 
何 创建 程序 。 


15.1 C 编译 器 


了 解 如 何 运行 C 编 译 器 能 让 你 看 透 Linux 上 的 程序 的 本 质 。 大 多 数 的 Linux 工 具 ， 以 及 很 多 
Linux 应 用 软件 ， 都 是 用 C 或 C++ 写成 的 。 本 章 主要 以 C 作 为 例子 ， 但 你 把 这 些 概念 搬 到 C++ 上 是 
没 问 题 的 。 

C 程 序 遵照 传统 的 开发 流程 : 写 代 码 、 编 译 代码 、 运 行 代码 。 也 就 是 说 ， 想 让 写 好 的 C 代 码 
能 运行 起 来 ， 你 必须 先 将 其 编译 成 计算 机 能 理解 的 、 低 层次 的 二 进 制 形式 。 你 可 拿 C 来 跟 后 面 讲 
到 的 一 些 脚本 语言 作对 比 ， 它 们 不 需要 编译 。 


注解 ”大 多 数 发 行 版 都 默认 不 含有 编译 C 的 工具 ,因为 它们 比较 占 空间 。 如 果 你 发 现 没有 这 些 工 
具 ， 对 于 Debian/Ubuntu， 你 可 以 安装 build-essential 包 ， 而 对 于 Fedora/CentOS， 则 可 以 用 
yum groupinstall。 如 果 不 行 ， 就 试 着 找 一 下 “C compiler”。 
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虽然 来 自 LLVM 项 目的 新 的 C 编 译 器 clang 越 来 越 流 行 ， 但 在 大 部 分 Unix 系 统 上 通行 的 C 编 译 
器 还 是 GNU C 编 译 需 gcc。C 源 码 的 文件 名 以 .c 结 尾 。 现 在 来 看 一 个 叫 hello.c 的 独立 的 C 源 码 文件 ， 
它 来 自 Brian W. Kernighan 和 Dennis M. Ritchie 的 著作 The C Programming Language, 2nd edition 
(Prentice Hall，1988 )。 


#include “stdio.h> 


main() { 
printf("Hello, World.\n"); 


将 以 上 代码 置 于 一 个 叫 hello.c 的 文件 中 ， 然 后 执行 以 下 命令 : 


$ cc hello.c 


这 样 会 产生 一 个 叫 a.out 的 可 执行 文件 , 你 可 以 像 运行 其 他 可 执行 文件 一 样 运行 它 。 不 过 , 你 
若 想 给 它 另 起 一 个 名 字 ( 例如 叫 hello )， 可 以 带 上 -o 选 项 : 


$ cc -0 hello hello.c 


小 程序 一 般 这 么 做 就 可 以 了 。 可 能 你 会 想 加 入 其 他 目录 或 者 库 〈 详 见 15.1.2 节 和 15.1.3 节 )， 
但 在 这 之 前 ， 我 们 先 看 看 一 个 稍微 大 点 的 程序 。 


15.1.1 多 个 源码 文件 


大 部 分 C 程 序 都 写 得 很 大 ， 不 宜 放 到 一 个 单独 的 源码 文件 中 。 大 文件 不 便于 程序 员 管 理 ， 编 
译 时 也 可 能 会 出 错 。 因 此 ， 开 发 者 会 将 代码 分 块 放 在 多 个 文件 中 。 

我 们 不 会 将 这 些 .c 文 件 马上 编译 成 可 执行 文件 ， 而 是 使 用 编译 器 的 -c 选 项 来 给 每 个 文件 生成 
对 应 的 对 象 文件 。 假 设 你 有 main.c 和 aux.c 两 个 文件 ,以 下 两 条 编译 器 命令 会 完成 建立 程序 的 大 部 
分 工作 : 


$ cc -c main.c 
$ cc -Cc aux.c 


以 上 两 命令 会 从 这 两 个 文件 编译 出 main.o 和 aux.o 两 个 对 象 文件 。 

对 象 文件 是 一 种 二 进 制 文件 ,除了 个 别 地 方 ， 处 理 器 差不多 能 解读 它 。 首 先 ,操作 系统 是 不 
知道 如 何 运行 对 象 文 件 的 ; 其 次 ， 你 可 能 会 需要 将 一 些 对 象 和 系统 库 组 合成 一 个 完整 的 程序 。 

要 从 一 个 或 多 个 对 象 文件 建立 一 个 功能 完整 的 可 执行 程序 ,你 需要 用 连接 器 , 如 Unix 中 的 1d 
命令 。 但 程序 员 是 很 少 在 命令 行 上 用 它 的 ， 因 为 C 编 译 需 包含 了 该 步骤。 所 以 ， 想 从 上 面 两 个 对 
象 文件 建立 myprog 的 话 ， 就 用 以 下 命令 来 连接 它们 : 


$ cc -o myprog main.o aux.0 
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虽然 这 样 可 以 手动 编译 多 个 源码 文件 , 但 正如 上 例 所 示 , 车 文件 太 多 的 话 , 编译 过 程 还 是 很 
难 管理 的 。15.2 节 讲 到 的 make 系 统 是 传统 Unix 上 标准 的 编译 管理 器 。 要 管理 下 两 节 提 到 的 那些 文 
件 ， 这 个 系统 尤为 重要 。 


15.1.2 头 (include) 文件 和 目录 


C 的 头 文件 是 用 于 保存 类 型 和 函数 声明 的 附加 文件 。 例 如 ，stdio.h 就 是 一 个 头 文件 ( 见 15.1 
节 中 的 小 程序 )。 

不 幸 的 是 , 有 很 多 编译 问题 是 与 头 文件 有 关 的 。 大 多 数 情况 下 是 因为 编译 器 找 不 到 头 文件 或 
库 。 有 些 情 况 下 是 因为 程序 员 忘 了 包含 必要 的 头 文件 ， 导 致 某 些 代码 编译 不 通过 。 

修复 include 文 件 的 问题 

记 住 正确 的 include 文 件 并 不 总 是 易 事 。 有 时 相同 名 字 的 include 文 件 放 在 了 不 同 的 目录 中 , 令 
人 难以 分 辨 哪个 才 是 需要 的 。 当 编译 器 找 不 到 include 文 件 时 ， 就 会 出 现 类 似 这 样 的 报错 信息 : 


badinclude.c:1:22: fatal error: notfound.h: No such file or directory 


该 信息 说 明了 badinclude.c 文 件 需 要 参考 的 notfound.h 头 文件 无 法 找到 。 这 个 错误 源 自 
badinclude.c 的 第 一 行 : 


#include <notfound.h> 


Unix 默 认 的 include 目 录 是 /usr/include, 编译 右 一 般 就 看 那里 , 除非 你 指定 它 看 别 的 地 方 。( 大 
多 数 包含 头 文件 的 路 径 都 会 带 有 include 的 名 字 。) 


注解 ”在 第 16 章 你 会 学 到 更 多 有 关 如 何 寻 找 丢 失 的 include 文 件 的 内 容 。 


假设 notfound.h 在 /usr/junk/include 中 ， 你 可 以 加 上 -I 选项 ， 让 编译 器 看 到 这 个 目录 : 


$ cc -Cc -I /usr/junk/include badinclude.c 


现在 就 不 会 因为 头 文件 的 引用 出 错 而 不 能 编译 了 。 
另外 ， 你 还 要 注意 include 中 双 引 号 〈"" ) 与 尖 括 号 (<> ) 的 区 别 : 


#include "myheader.h" 


双 引 号 意味 着 头 文件 不 在 系统 的 include 目 录 中 ， 需 要 编译 器 从 其 他 地 方 寻找 。 这 通常 表 
示 它 与 源码 文件 处 于 同一 目录 中 。 如 果 你 使 用 双 引 号 时 出 现 问题 ， 可 能 是 你 要 编译 的 程序 并 
不 完整 。 

什么 是 C 预 处 理 器 

其 实 ， 并 不 是 C 编 译 器 去 寻找 include 文 件 ， 而 是 C 预 处 理 器 ( C Preprocessor， 简 称 cpp )。 它 
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是 编译 器 在 解析 程序 之 前 先 在 源码 上 运行 的 一 个 东西 。 预 处 理 髓 会 将 源码 重 写成 一 种 编译 器 能 理 
解 的 形式 ， 它 能 使 源码 更 易 读 ( 并 提供 捷径 )。 
源码 中 的 预 处 理 器 命令 叫 作 指令 (directive )， 它 们 以 # 开 头 ， 分 为 以 下 三 种 。 

口 include 文 件 : 提 nclude 指 令 会 使 预 处 理 器 将 整个 文件 包含 进来 。 例如 在 上 节 中 提 到 的 , 是 

编译 器 的 -I 选项 让 预 处 理 器 在 指定 目录 中 搜索 include 文 件 。 

口 宏 定义 : #define BLAH something 这 样 的 一 行 ， 会 使 预 处 理 器 将 源码 中 所 有 的 BLAH 替 换 成 
something。 一 般 我 们 约定 宏 的 名 字 都 是 大 写 的 ,但 有 人 会 将 宏 的 名 字 起 得 像 函 数 名 或 变 
量 名 。( 这 一 直 都 很 让 人 头痛 ， 更 有 许多 程序 员 对 滥用 预 处 理 器 的 现象 吐 之 以 鼻 。) 

口 条 件 : 你 可 以 用 柚 fdef 、 挫 f 和 #endif 来 对 代码 进行 分 块 。 提 fdef MACRO 指 令 用 于 检查 宏 
MACRO 是 否 已 定义 ， 而 拉 f condition 则 检查 condition 是 否 非 零 。 当 预 处 理 器 发 现 计 语 
句 后 的 条 件 为 false 时 ， 它 就 不 会 将 扩 f 和 #endif 之 间 的 代码 交 给 编译 器 。 如 果 你 想 看 懂 C 
程序 ， 最 好 先 习惯 这 种 指令 。 


注解 ”你 也 可 以 不 在 源码 中 定义 宏 , 而 用 编译 器 的 -D 选 项 来 实现 : -DBLAH=something。 它 的 效果 
就 如 上 面 的 #define BLAH something。 


下 面 有 一 个 条 件 指令 的 例子 。 当 预 处 理 器 遇 到 这 段 代码 时 ， 它 会 检查 宏 DEBUG 是 否 已 定义 。 
如 果 是 ， 它 就 会 将 fprintf() 那 行 交 给 编译 器 ， 和 否则 ， 就 跳 过 该 行 ， 继 续 处 理 #endif 后 的 代码 。 


#ifdef DEBUG 
fprintf(stderr, "This is a debugging message.\n"); 
#endif 


注解 C 预 处 理 器 并 不 懂 C 的 任何 语法 、 变 量 、 函 数 或 其 他 元 素 ， 它 只 看 宏和 指令 。 


Unix 上 的 C 预 处 理 器 是 cpp， 你 也 可 以 用 gcc -E 来 运行 它 。 不 过 你 一 般 很 少 需要 单独 运行 预 处 
理 角 。 


15.1.3 ”连接 库 


C 编 译 器 对 系统 了 解 得 不 多 ， 不 足以 创建 出 有 用 的 程序 。 你 需要 额外 加 上 一 些 库 来 创建 完整 
的 程序 。 所 谓 C 库 ， 就 是 一 些 已 编译 好 的 、 通 用 的 、 可 让 你 添加 到 自己 程序 的 函数 。 例 如 ， 许 多 15 
可 执行 程序 都 会 用 到 数学 库 ， 因 为 其 中 包含 了 三 角 函数 之 类 的 东西 。 

库 主要 是 在 连接 的 时 候 ( 即 连接 器 从 对 象 文 件 产生 可 执行 程序 之 时 ) 发 挥 作用 。 比 如 说 , 你 
有 一 个 需要 用 到 gobject 库 的 程序 , 但 你 忘 了 告诉 编译 器 你 需要 连接 它 , 那么 你 就 会 看 到 这 样 的 错 


误 信息 2 
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badobject.o (.text+0x28): undefined reference to 'g object new' 


这 条 报错 信息 的 关键 是 g_object_new 部 分 。 当 连接 器 检查 badobject.o 这 个 对 象 文件 时 , 发 现 
找 不 到 g_object_new 这 个 函数 ， 于 是 就 无 法 创建 程序 了 。 对 于 这 个 例子 ， 你 可 以 怀疑 是 你 自己 忘 
记 加 上 gobject 库 了 ， 因 为 错误 信息 说 找 不 到 的 函数 是 g_object_new()。 


注解 undefined reference 并 不 总 是 代表 找 不 到 库 。 还 有 可 能 是 你 漏 了 连接 某 个 对 象 文件 。 不 
过 区 分 库 函 数 和 你 自己 的 函数 应 该 是 容易 的 。 


要 解决 这 个 问题 , 首先 你 要 知道 gobject 库 在 哪里 ,然后 再 用 编译 器 的 -1 选项 连接 它 。 跟 include 
文件 相似 ， 库 分 布 在 系统 的 各 个 地 方 ( 默认 是 在 /usr/lib 中 )， 大 多 数 会 放 在 名 为 lib 的 子 目录 中 。 
而 对 于 上 例 ， 基 本 的 gobject 库 文件 是 libgobject.a， 而 库 的 名 字 是 gobject。 所 以 完整 的 连接 和 编译 
应 是 这 样 : 


$ cc -0 badobject badobject.o -lgobject 


如 果 库 的 所 在 地 不 在 常规 位 置 ， 你 必须 用 -L 选 项 来 告诉 连接 器 。 假 设 padobject 程 序 需要 用 
到 /usr/junk/lib 中 的 libcrud.a， 那 么 就 应 该 这 样 编译 : 


$ cc -0 badobject badobject.o -lgobject -L/usr/junk/lib -lcrud 


注解 ”如 果 你 想 在 一 个 库 中 搜索 特定 的 函数 ， 可 用 nm， 它 会 列 出 很 多 东西 。 比 如 试 试 这 条 : nm 
libgobject.a。( 你 可 能 要 用 locate 命 令 来 查找 libgobject.a;i 现在 很 多 发 行 版 会 将 库 放 在 
/usrlib 特 定 的 子 目 录 中 。) 


15.1.4 ”共享 库 


名 称 以 .a 结尾 的 库 ( 如 libgobject.a ) 是 静态 库 。 当 程序 连接 的 是 静态 库 时 ， 连 接 旭 会 将 库 
件 中 的 机 器 码 复制 到 你 的 程序 中 。 于 是 ,最 终 的 可 执行 程序 不 需要 该 库 也 能 运行 起 来 ,并 且 其 所 
引用 到 的 行为 将 不 会 改变 。 

然而 ， 库 是 会 一 直 变 大 的 ， 就 如 同 库 会 变 多 一 样 ， 所 以 复制 静态 库 很 浪费 磁盘 和 内 存 空间 。 
另外 ,如 果 某 天 你 发 现 所 用 的 静态 库 有 问题 , 需要 修改 或 替换 ,那些 引用 到 它 的 程序 就 都 要 重新 
编译 ,才能 使 用 到 新 的 库 。 

共享 库 就 没有 这 种 问题 。 引用 共享 库 的 程序 只 会 在 需要 时 才 将 该 库 加 载 到 内 存 中 。 而 且 多 个 
进程 可 以 共享 内 存 中 的 同一 个 共享 库 。 修 改 共享 库 的 代码 不 需要 重 编译 那些 引用 它 的 程序 。 

使 用 共享 库 的 代价 是 管理 困难 、 连 接 复杂 。 但 是 ， 只 要 明白 以 下 四 点 ， 你 就 能 搞定 它 : 
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口 如 何 列 出 程序 需要 的 共享 库 ; 
口 程序 如 何 查找 共享 库 ; 
口 如 何 让 程序 连接 共享 库 ; 
口 常见 的 共享 库 陷阱 。 

接 下 来 的 小 节 会 告诉 你 怎样 使 用 和 维护 你 系统 的 共享 库 。 如 果 你 想 大 致 了 解 共 享 库 的 工作 原 
理 或 者 了 解 连接 器 ， 你 可 以 参考 John R. Levine 的 著作 Linkers and Loaders (Morgan Kaufmann ， 
1999 ) 和 David M. Beazley、Brian D. Ward 、Ian R. Cooke 合 车 的 The Inside Story on Shared Libraries 
and Dynamic Loading( Computing in Science & Engineering, 2001 ), 或 者 是 Program Library HOWTO 
( http://dwheeler.com/program-library/ ) 之 类 的 在 线 资源 。 另 外 ，ld.so(8) 帮 助手 册 也 值得 一 读 。 

列 出 共享 库 的 依赖 关系 

共享 库 与 静态 库 通 常 放 在 同一 个 地 方 。Linux 的 两 大 标准 库 目录 是 /lib 和 /usr/lib。 其 中 /lib 是 不 
应 该 包含 静态 库 的 。 

共享 库 的 名 字 的 后 级 中 通常 含有 .so ( 意 为 共享 对 象 )， 比 如 libc-2.15.so 和 libe.so.6。 想 看 一 个 
程序 用 到 了 什么 共享 库 ， 可 运行 1dd prog， 其 中 prog 是 程序 名 。 以 下 用 bash 来 举例 : 


$ 1dd /bin/bash 
linux-gate.so.1 => (0xb7799000) 
libtinfo.so.5 => /lib/i386-linux-gnu/libtinfo.so.5 (0xb7765000) 
libdl.so.2 => /lib/i386-linux-gnu/libdl.so.2 (0xb7760000) 
libc.so.6 => /lib/i386-linux-gnu/libc.so.6 (0xb75b5000) 
/lib/1d-linux.so.2 (0xb779a000) 


考虑 到 最 佳 性 能 和 灵活 性 , 可 执行 程序 本 身 通常 是 不 知道 它 所 用 的 共享 库 的 所 在 位 置 的 。 它 
只 知道 共享 库 的 名 字 ， 或 只 知道 一 点 寻找 共享 库 的 提示 。1d.so 这 个 小 程序 ( 它 是 运行 时 动态 连 
接 器 /加 载 器 ) 可 以 为 程序 在 运行 时 找到 并 加 载 共 享 库 。 以 上 1dd 的 输出 中 ,左边 是 可 执行 程序 所 
知道 的 库 的 名 字 ， 右 边 是 1d.so 所 找到 的 库 的 位 置 。 

输出 的 最 后 一 行 显 示 了 1d.so 的 实际 位 置 : /Lib/1d-linux.so.2。 

1d.so 怎 样 找到 共享 库 

共享 库 的 一 个 常见 问题 是 动态 连接 器 无 法 找到 库 。 如 果 可 执行 程序 有 预先 配置 好 的 运行 时 库 
搜索 路 径 (runtime library search path， 以 下 简称 rpath ) 的 话 ， 则 动态 连接 器 一 般 会 首先 查找 那里 。 
很 快 你 就 会 看 到 怎样 创建 这 个 路 径 。 

接着 ,动态 连接 器 就 会 参考 系统 缓存 /etc/ld.so.cache, 看 看 该 库 是 否 在 常规 的 位 置 。 这 是 从 组 
存 配置 文件 /etc/ld.so.conf 中 的 目录 列表 获取 的 库 文件 名 字 的 快速 缓存 。 


注解 ”正如 你 所 见 的 其 他 Linux 配 置 文 件 一 样 ,1d.so.conf 可 能 会 包含 /etc/ld.so.conf.d 中 的 配置 文件 。 


在 ld.so.conf 里 ， 每 一 行 就 是 一 个 你 要 包含 到 缓存 里 的 目录 。 这 个 列表 通常 很 得， 内 容 类 似 
这 样 : 
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/lib/i686-linux-gnu 
/usr/1ib/i686-1inux-gnu 


标准 的 库 目录 /lib 和 /usrvlib 是 隐 式 的 ， 即 你 不 需要 在 /etc/ld.so.conf 中 包含 它们 。 
如 果 你 改动 了 1d.so.conf 或 者 改变 了 某 个 共享 库 的 目录 ， 你 都 必须 通过 以 下 命令 来 手动 重建 
/etc/ld.so.cache 文 件 : 


# ldconfig -v 


-Vv 选项 会 输出 被 1dconfig 添 加 到 缓存 的 目录 的 详细 信息 和 它 所 监测 到 的 改动 。 

1d.so 找 共享 库 时 还 会 参考 一 个 地 方 : 环境 变量 LD_LIBRARY_PATH。 我 们 很 快 就 会 讲 到 。 

不 要 养 成 往 /etc/ld.so.conf 里 乱 塞 东西 的 习惯 。 你 应 该 清楚 系统 缓存 中 有 哪些 共享 库 ， 而 如 果 
你 把 杂七杂八 的 东西 都 放 进去 , 你 就 会 面临 一 个 难以 管理 的 系统 ,并 可 能 有 混淆 的 风险 。 如 果 你 
想 给 程序 安排 一 个 隐 含 的 库 路 径 ， 你 可 以 使 用 内 置 的 rpath。 下 面 来 看 看 怎么 做 。 

把 程序 与 共享 库 连 接 起 来 

假设 你 在 /opt/obscure/lib 中 有 一 个 叫 libweird.so.1 的 动态 库 ， 并 需要 把 它 与 myprog 连 接 ， 可 以 
这 么 做 : 


$ cc -0 myprog myprog.o -Wl1,-rpath=/opt/obscure/lib -L/opt/obscure/lib -lweird 


-Wl1、-rpath 用 于 告诉 连接 右 将 某 个 目录 包含 到 程序 的 rpath 中 。 虽 然 写 了 - 册 、-rpath， 但 还 
是 需要 加 上 -L。 

对 于 已 编译 的 程序 ， 可 以 使 用 patchelf 来 加 入 不 同 的 rpath， 不 过 最 好 还 是 在 编译 时 就 做 好 。 

共享 库 的 一 些 问题 

共享 库 的 灵活 性 和 一 些 惊 人 的 技巧 会 有 被 滥用 的 风险 ， 进 而 可 能 让 你 的 系统 变 得 乱七八糟 。 
可 能 导致 的 后 果 有 以 下 三 种 : 
口 找 不 到 库 ; 
口 性 能 低 ; 
口 找 错 库 。 

出 现 共享 库 问 题 的 头号 原因 来 自 环境 变量 LD_LIBRARY_PATH。 把 一 些 以 冒号 分 隔 的 目录 赋值 到 
这 个 变量 的 话 ， 就 可 令 1d.so 首 先 查 找 这 些 目录 。 如 果 你 没有 源码 ， 或 不 能 用 patchelf， 又 或 者 
你 只 是 不 想 重 新 编译 ， 你 都 可 以 用 这 招 快速 解决 库 移动 后 的 依赖 问题 。 但 这 可 能 会 造成 混乱 。 

永远 都 不 要 在 启动 文件 中 或 在 编译 软件 时 设置 LD_ LIBRARY_PATH。 动 态 运行 时 连接 器 看 到 这 个 

量 时 ， 就 会 对 其 中 设 定 的 目录 进行 库 的 搜索 。 这 不 仅 会 造成 性 能 低下 ,而 且 更 重要 的 是 , 它 可 

能 会 导致 库 混 淆 ， 因 为 运行 时 连接 器 会 为 每 一 个 程序 到 这 些 目录 中 查找 库 。 
如 果 有 一 些 没 有 源码 的 无 足 轻重 的 程序 ( 又 或 者 是 一 些 你 不 想 重 编译 的 应 用 ， 如 Mozilla 等 ) 
迫使 你 用 LD_LIBRARY_PATH 来 解决 库 依 赖 问题 , 那 就 将 它 租 套 进 脚本 里 。 假设 你 有 一 个 可 执行 程序 
/opt/crummy/bin/crummy.bin, 它 需 要 /opt/cruommy/lib 中 的 共享 库 , 你 可 以 写 一 个 类 似 这 样 的 crummy 
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冬 套 脚本 : 


#!/bin/sh 
LD_LIBRARY_PATH=/opt/crummy/l1ib 
export LD_LIBRARY_PATH 

exec /opt/crummy/bin/crummy.bin $@ 


不 使 用 LD_LIBRARY_PATH 能 避免 大 部 分 共享 库 问题 。 但 开发 者 可 能 还 会 遇 到 一 个 偶尔 出 现 的 大 
问题 ， 就 是 库 的 应 用 程序 接口 (Application Programming Interface， 以 下 简称 API ) 改变 了 ,使 得 
装 好 的 软件 都 用 不 了 。 最 好 的 解决 方法 就 是 预防 。 具 体 做 法 是 : 安装 库 时 也 使 用 -ML 、-irpath ， 
或 者 使 用 静态 库 。 


15.2 make 


如 果 一 个 程序 需要 用 到 不 止 一 个 源码 文件 , 或 者 需要 在 编译 时 加 上 一 些 奇怪 的 选项 的 话 , 那 
么 手动 编译 就 很 麻烦 了 。 这 个 问题 曾经 困扰 了 人 们 很 久 ， 直至 Unix 上 出 现 了 一 个 叫 make 的 编译 管 
理工 具 。Unix 的 使 用 者 应 该 对 make 有 所 了 解 ， 因 为 有 些 系统 工具 是 会 用 到 它 的 。 不过， 本 章 只 会 
谈 到 它 的 冰山 一 角 。 关 于 make 的 东西 是 可 以 写 出 一 本 书 的 ， 例 如 Robert Mecklenburg 的 Managing 
Projects with GNU Make( O’Reilly，2004 )。 此 外 ， 大 多 数 的 Linux 包 都 是 由 封装 过 的 make 或 类 似 
的 工具 构建 的 。 构 建 系统 有 很 多 ， 其 中 有 个 叫 autotools 的 ， 我 们 会 在 第 16 章 谈 及 。 

make 是 一 个 很 大 的 系统 ,但 它 并 不 难 理解 。 当 看 到 有 叫 Makefile 或 makefile 的 文件 时 ， 就 说 明 
你 遇 上 make 了 。( 试 着 运行 make 看 你 能 构建 什么 东西 。) 

make 背 后 的 理念 就 是 目标 ， 即 你 想 达 到 的 目的 。 目 标 可 以 是 文件 (一 个 .o 文 件 或 一 个 可 执行 
文件 等 等 ) 或 者 标签 。 男 外 ， 有 些 目 标 是 依赖 于 其 他 目标 的 。 举 例 来 说 ,在 连接 之 前 ， 你 得 先 做 
好 一 堆 .o 文 件 。 这 种 需求 就 是 依赖 关系 。 

make 会 根据 一 些 规则 ( 例如 怎样 把 .c 文 件 变 成 .o 文 件 ) 来 构建 目标 。make 本 身 就 有 一 些 规则 ， 
但 你 也 可 以 修改 它 ， 或 增加 自己 的 规则 。 


15.2.1 一 个 Makefile 实 例 


看 一 下 这 个 简单 的 Makefile， 它 会 将 aux.c 和 main.c 构 建成 一 个 叫 myprog 的 程序 : 


# object files 
0B]JS=aux.o main.o 


myprog: $(0BJS) 
$(CC) -o myprog $(0BJS) 


第 一 行 开 头 的 # 表 示 该 行 是 注释 。 
下 面 一 行 是 宏 定 义 ， 它 把 0BJS 赋 值 为 两 个 对 象 文件 ， 这 对 于 后 续 的 操作 很 重要 。 现 在 ,你 要 
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知道 如 何 定 义 宏 ， 以 及 如 何在 以 后 再 次 使 用 它 ( $(0BIS) )。 

接 下 来 是 第 一 个 目标 a11。 第 一 个 目标 就 是 运行 nake 后 所 要 达到 的 最 终结 果 。 

构建 目标 的 规则 写 在 冒号 后 面 。 对 于 all 来 说 ， 就 是 满足 一 个 叫 myprog 的 东西 。 这 就 是 本 文 
件 的 第 一 个 依赖 关系 : all 依 赖 于 myprog。 注 意 ，myprog 可 以 是 一 个 实际 的 文件 ， 也 可 以 是 男 一 
个 规则 的 目标 。 在 本 例 中 ， 它 两 者 都 是 ( 既是 a11 的 规则 ， 也 是 0BJS 的 目标 )。 

为 了 构建 myprog， 这 个 Makefile 在 依赖 关系 中 使 用 了 $(0BJS)。 该 宏 展开 成 aux.o 和 main.o， 于 
是 myprog 就 依赖 于 这 两 个 文件 了 ( 它们 必须 是 文件 ,因为 该 Makefile 中 没有 其 他 名 为 aux.o 或 main.o 
的 目标 )。 

该 Makefile 假 设 你 有 两 个 叫 aux.c 和 main.c 的 C 源 码 文件 与 其 在 同一 目录 中 。 执行 make 的 话 , 就 
会 产生 以 下 输出 ， 其 中 显示 了 make 所 运行 的 命令 : 


$ make 
CC -C -0 auXx.0 aux.c 
CC -C -0 main.o main.c 


cc -0 myprog aux.o main.o 


图 15-1 展 示 了 这 些 依赖 关系 。 


ree 


图 15-1 ”Makefile 依 赖 关系 


15.2.2 ”内 置 规则 


那么 make 是 怎么 知道 要 将 aux.c 变 成 aux.o 的 呢 ? 不 管 怎 么 看 ，aux.c 都 没 在 Makefile 中 出 现 过 。 
答案 就 是 ，make 有 自己 内 置 的 规则 。 当 你 需要 .o 文 件 时 ， 它 就 会 自动 去 找 .c 文 件 ， 它 甚至 懂得 
那些 .ec 文件 运行 cc -c 命 令 ， 以 达到 获得 .o 文 件 的 目标 。 


15.2.3 ”最 终 的 程序 构建 
创建 myprog 的 最 后 一 步 有 点 复杂 ， 但 其 思想 是 很 简单 的 。$(0BJS) 有 了 两 个 对 象 文件 之 后 ， 


对 
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你 就 可 以 按照 最 后 一 行 来 运行 C 编 译 吉 了 《这 里 $(CC) 展 开 成 编译 器 的 名 字 ): 


$(CC) -o myprog $(0BJS) 


$(CC) 前 的 空格 是 tab 键 。 任 何 真 实 的 命令 前 面 都 必须 要 有 tab 键 。 小 心 以 下 这 种 情况 : 


Makefile:7: *** missing separator. Stop. 


这 种 错误 是 说 Makefile 损 坏 了 。tab 键 就 是 分 隔 符 。 如 果 没 有 分 隔 符 ,或 者 出 现 其 他 干扰 ， 你 
就 会 看 到 这 样 的 错误 提示 。 
15.2.4 ”保持 更 新 


make 的 基础 知识 还 有 最 后 一 点 ， 就 是 目标 需要 跟 它 的 依赖 关系 一 同 更 新 。 如 果 你 对 上 例 make 
两 次 ， 那 么 第 一 次 会 构建 出 myprog， 而 第 二 次 则 会 给 出 这 样 的 信息 : 


make: Nothing to be done for 'all'. 


在 第 二 次 时 ,make 会 发 现 规则 中 的 myprog 已 经 存在 , 而 且 自 从 上 次 构建 之 后 ,， 所 有 依赖 关系 
都 未 曾 改 变 ， 于 是 它 就 不 会 再 次 构建 myprog。 要 解决 这 个 问题 ， 可 按 以 下 步骤 执行 。 

(1) 执行 touch aux.c。 

(2) 再 次 执行 make。 这 次 ，make 发 现 aux.c 比 目录 中 已 有 的 aux.o 更 新 ， 于 是 它 就 会 再 次 编译 出 
aux.0。 

(3) myprog 是 依赖 于 aux.o 的 ， 而 现在 aux.o 比 已 有 的 myprog 更 新 ， 于 是 它 就 会 再 次 构建 出 
myprog。 

这 是 一 种 典型 的 反应 链 。 


15.2.5 ”命令 行 参 数 与 选项 


熟悉 make 的 命令 行 参数 和 选项 的 话 ， 你 会 获得 很 多 便利 。 

最 有 用 的 选项 之 一 就 是 在 命令 行 上 指定 一 个 单独 的 目标 。 对 于 上 面 例子 ， 如 果 你 只 想得到 
aux.0 的 话 ， 可 以 执行 make aux.o。 

你 也 可 以 在 命令 行 定义 一 个 宏 。 例 如 ， 想 使 用 clang 编 译 器 的 话 ， 试 试 : 


$ make CC=clang 


这 样 ，make 就 会 使 用 你 定义 的 cc 来 取代 原本 的 编译 器 cc。 命令 行 宏 对 于 测试 预 处 理 髓 定义 和 
库 是 很 有 用 的 ， 尤 其 是 有 CFLAGS 和 LDFLAGS 时 ， 这 两 个 我 们 很 快 就 会 讲 到 。 
实际 上 , 运行 make 不 一 定 要 有 Makefile。 如果 内 置 的 make 规 则 能 完成 目标 , 你 可 以 直接 叫 make 
去 执行 目标 。 例 如 ， 你 有 一 个 叫 blah.c 的 简单 程序 ， 试 下 make blah， 它 会 这 样 做 : 


图 灵 社 区 会 员 小 虎 (164142021@qq.com) 专 享 尊重 版 权 


$ make blah 
cC blah.o -o blah 


这 种 make 只 适用 于 最 简单 的 C 程 序 。 如 果 你 的 程序 需要 用 到 库 , 或 者 需要 特别 的 include 目 录 ， 
那 你 还 是 应 该 写 个 Makefile。 在 你 不 了 解 编译 器 的 运作 原理 ， 而 又 想 编译 一 些 例如 Fortran、Lex、 
Yacc 之 类 的 东西 时 ， 确 实 可 以 直接 make 而 不 用 Makefile。 为 什么 不 试 着 让 make 帮 你 搞定 呢 ? 就 算 
它 做 不 到 ， 它 也 会 友善 地 提示 你 如 何 操作 。 

make 还 有 以 下 两 个 好 用 的 选项 。 
口 -n: 显示 一 次 构建 所 要 用 到 的 命令 ,但 并 不 执行 它们 。 
口 -f file: 告诉 make 使 用 Makefile 和 makefile 以 外 的 文件 。 


15.2.6 ”标准 宏和 变量 

make 有 很 多 特别 的 宏和 变量 。 宏 和 变量 的 区 别 很 难说 清 ， 所 以 ,我 们 会 把 make 启 动 以 后 不 再 
改动 的 东西 叫 作 宏 。 

如 前 文 提 到 的 ， 你 可 以 在 Makefile 的 开头 设置 安 。 以 下 是 最 常见 的 一 些 宏 。 
口 CFLAGS: C 编 译 器 选项 make 会 将 这 个 选项 作为 参数 , 在 将 .c 文 件 变 成 .o 的 阶段 传 给 编译 器 。 
口 LDFLAGS: 类 似 CFLAGS， 不 过 它 是 在 将 .o 变 成 可 执行 程序 的 阶段 传 给 连接 器 。 
口 LDLIBS: 如 果 你 用 了 LDFLAGSs， 但 不 想 库 名 选项 与 查找 路 径 混 在 一 起 ， 可 以 将 库 名 选项 写 
在 这 里 。 
口 CC: C 编 译 句 。 默 认 是 cc。 
口 CPPFLAGS: C 预 处 理 器 选项 。make 运 行 预 处 理 器 时 ， 将 其 作为 参数 。 
口 CXXFLAGS: GNU 使 用 这 个 宏 作为 C+ 编译 器 选项 。 

make 交 量 会 随 着 日 标的 构建 而 改变 。 因 为 我 们 永远 都 只 是 在 使 用 make 变 量 ， 而 不 会 去 手动 设 
置 它们 ， 所 以 把 它们 都 带 上 $ 就 好 了 。 
口 4: 写 在 规则 里 时 ， 表 示 当 前 目标 。 
口 $#: 当前 目标 的 基 名 。 例 如 ， 在 构建 blah.o 时 ， 它 表示 为 blah。 
最 完整 的 make 变 量 列表 在 make 的 帮助 手册 中 。 


注解 ”注意 ，GNU 的 make 有 很 多 其 他 变种 所 没有 的 扩展 、 内 置 规则 和 特性 。 如 果 你 只 在 Linux 上 
使 用 ,， 那 没什么 问题 ， 但 如 果 是 迁 到 Solaris 或 BSD 机 器 的 话 ， 就 不 一 定 能 产生 相同 的 效果 
了 。 好 在 我 们 有 GNU autotools 这 类 工具 来 解决 跨 平台 的 问题 。 


15.2.7 ”常规 的 目标 
大 部 分 的 Makefile 都 包含 了 一 些 用 于 辅助 编译 的 常规 目标 ， 如 下 所 示 。 
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口 clean: 这 个 目标 无 处 不 在 。make clean 通 常会 把 所 有 对 象 文件 和 可 执行 程序 都 清 掉 ， 以 
便 你 重新 构建 或 者 打包 软件 。 以 下 就 是 一 个 例子 : 


clean : 
rm -f $(0BJS) myprog 


口 distclean: GNU autotools 所 生成 的 Makefile 总 会 有 这 个 目标 。 它 能 删除 原 包 以 外 的 所 有 
东西 ， 包 括 Makefile。 在 第 16 章 你 会 学 到 更 多 。 偶 尔 你 会 发 现 有 些 开发 者 不 喜欢 用 这 个 目 
标 来 清除 可 执行 程序 ， 而 更 喜欢 用 realclean。 

口 install: 将 文件 和 编译 好 的 程序 放 到 Makefile 认 为 适当 的 地 方 。 这 可 能 会 有 风险 ， 所 以 

最 好 还 是 先 用 make -n instal1 看 看 会 放 在 哪里 。 

口 test 或 check: 有 些 开 发 者 会 加 上 test 或 check 目 标 来 检验 构建 出 的 东西 是 否 可 用 。 

口 depend: 通过 编译 髓 的 -Mi 选项 来 检查 源码 ， 以 建立 依赖 关系 。 这 是 一 个 不 寻常 的 日 标 ， 因 
为 它 经 常会 改动 Makefile 自 身 。 这 已 经 不 是 一 种 通用 的 做 法 了 , 但 如 果 你 遇 到 要 求 你 这 么 
做 的 情况 ， 那 最 好 还 是 照 着 去 做 。 

口 all: 通常 是 Makefile 的 第 一 个 目标 。 经 常 有 人 写 al1 而 不 是 写 要 构建 的 程序 名 。 


15.2.8 组 织 一 个 Makefile 


虽然 Makefile 的 风格 多 样 , 但 有 些 规范 是 大 多 数 程序 员 都 遵守 的 。 其 中 一 条 就 是 , 在 Makefile 
的 第 一 部 分 (安定 义 ) 定义 好 不 同 用 途 的 库 和 include: 


MYPACKAGE_INCLUDES=-I/usr/local/include/mypackage 
MYPACKAGE LIB=-L/usr/local/lib/mypackage -lmypackage 
PNG_INCLUDES=-I/usr/local/include 
PNG_LIB=-L/usr/local/lib -lpng 


于 是 各 种 编译 器 和 连接 器 的 选项 就 由 这 些 宏 组 合 而 成 : 


CFLAGS=$(CFLAGS) $(MYPACKAGE INCLUDES) $(PNG INCLUDES) 
LDFLAGS=$ (LDFLAGS) $(MYPACKAGE LIB) $(PNG LIB) 


可 复 用 的 对 象 文件 则 要 定义 好 。 例 如 ,假设 你 的 包 会 创建 出 名 为 boring 和 trite 的 可 执行 程 
序 ， 它 们 有 各 自 的 .c 文 件 ， 并 且 都 需要 用 到 util.c， 则 可 以 这 样 定义 : 


UTIL 0BJS=util.o 


BORING OBJS=$(UTIL 0BJS) boring.o 
TRITE OBJS=$(UTIL 0BJS) trite.o 


PROGS=boring trite 


Makefile 的 剩余 部 分 就 会 是 这 样 : 
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all: $(PROGS) 


boring: $(BORING OBJS) 
$(CC) -o $@ $(BORING 0BJS) $(LDFLAGS) 


trite: $(TRITE OBJS) 
$(CC) -0 $@ $(TRITE 0B]S) $(LDFLAGS) 


你 可 以 将 两 个 生成 可 执行 程序 的 目标 放 在 同一 条 规则 里 , 但 这 不 是 一 种 好 的 做 法 , 因为 这 样 
会 使 规则 难以 拆 分 和 复 用 ， 甚 至 会 造成 错误 的 依赖 关系 : 如 果 boring 和 trite 处 于 同一 条 规则 中 ， 
那么 它们 就 都 会 依赖 于 对 方 的 .ce 文件， 这 样 的 话 ， 就 算 你 只 改动 了 其 中 一 个 .c， 也 会 使 nake 重 新 
构建 boring 和 trite。 


注解 ”如果 某 个 对 象 文件 有 特别 的 规则 ， 就 将 该 规则 置 于 构建 可 执行 程序 的 规则 之 上 。 如 果 多 
个 可 执行 程序 用 到 相同 的 对 象 文件 , 就 将 该 对 象 文件 的 规则 置 于 可 执行 程序 的 规则 之 上 。 


15.3 ”调试 器 


Linux 上 标准 的 调试 器 是 gdb。 除 此 之 外 ， 界 面 友好 的 EclipseIDE 和 Emacs 系统 也 是 Linux 文 持 
的 。 如 果 和 希望 你 的 程序 产生 完整 的 调试 信息 ,可 带 -g 选 项 运行 编译 器 ， 以 在 程序 中 写 入 符号 表 和 
其 他 调试 信息 。 以 下 是 对 名 为 program 的 可 执行 程序 运行 gdb: 


$ gdb program 


接着 你 会 得 到 一 个 (gdb) 提 示 符 ， 然 后 可 以 这 样 传递 命令 行 参数 ( 假设 参数 为 options ): 


(gdb) run options 


如 果 程 序 是 可 行 的 ， 它 就 会 正常 启动 、 运 行 、 退 出 。 而 如 果 有 问题 的 话 ，gdb 就 会 停止 ， 打 
印 出 错误 的 代码 ， 并 回 到 (gdb) 提 示 符 。 因 为 打印 出 的 代码 通常 就 是 问题 的 所 在 ， 所 以 可 能 需要 
将 其 中 的 变量 也 打印 出 来 。( print 命 令 也 适用 于 数组 和 C 结 构 体 。) 


(gdb) print variable 


想 要 gdb 在 某 段 代码 上 和 暂停， 可 以 使 用 断 点 功能 。 以 下 例子 中 ，file 是 源码 文件 ，line num 是 
需要 和 暂停 的 位 置 : 


(gdb) break file:l1ine_ num 


想 让 gdb 继 续 往 下 执行 ， 可 这 样 做 : 
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(gdb) continue 


想 清 除 断 点 ， 输 入 : 


(gdb) clear file:1ine_ num 


本 节 对 gdb 的 介绍 是 极 简单 的 ， 你 可 以 在 线 获取 更 详尽 的 手册 ， 或 参考 Richard M. Stallman et 
al. 的 Debugging with GDB, 10th edition (GNU Press，2011 )。 而 关于 调试 则 可 看 看 Norman Matloff 
和 了 Peter Jay Salzman 的 7Tje Art of Debugging (No Starch Press, 2008 )。 


注解 ”如 果 想 挖掘 内 存 问 题 和 生成 统计 信息 ， 试 试 Valgrind (http:/valgrind.org/ )。 


15.4 Lex 和 Yacc 


如 果 你 要 编译 的 程序 需要 读 取 配置 文件 或 命令 ， 那 你 可 能 要 用 到 Lex 和 Yacc。 这 两 个 工具 是 
用 于 制作 编程 语言 的 。 
口 Lex 是 一 个 词法 分 析 器 的 生成 器 ， 它 能 将 文本 内 容 转换 成 一 个 个 标记 。 其 GNU/Linux 版 本 
叫 作 flex。 你 可 使 用 编译 器 的 -11 或 -1f1 连 接 器 标记 来 连接 Lex 的 库 。 
口 Yacc 是 一 个 语法 分 析 器 的 生成 器 ， 能 根据 语法 来 读 取 标 记 。GNU 的 分 析 器 是 bison。 为 使 
生成 的 语法 分 析 器 与 Yacc 兼 容 ， 你 需要 执行 bison -y。 你 可 使 用 编译 器 的 -ly 连接 器 标记 
来 连接 Yacc 的 库 。 


15.5 ”脚本 语言 


以 前 ，Unix 管 理 员 一 般 都 不 太 关 心 Bourne shell 和 awk 以 外 的 脚本 语言 。 现 在 shell 脚 本 (第 11 
章 讲 到 的 ) 依然 是 Unix 的 重要 组 成 部 分 ， 而 awk 脚本 则 逐渐 没落 。 另 外 ， 很 多 强大 继任 者 的 出 现 
也 使 得 不 少 系 统 编程 从 C 转 换 到 了 脚本 语言 ( 如 whois 程 序 )。 现 在 我 们 来 看 一 些 基 本 的 脚本 编程 。 

首先 你 要 知道 的 是 , 所 有 脚本 语言 的 第 一 行 是 跟 Bourne shell 的 shebang 类 似 的 。 例 如 ，Python 
脚本 的 第 一 行 大 概 是 这 样 的 : 


#!/usr/bin/python 


或 者 这 样 


#!/usr/bin/env python 


在 Unix 中 ， 所 有 以 #! 开 头 的 可 执行 文本 文件 都 是 脚本 。 其 后 的 路 径 是 该 脚本 的 解释 器 。 当 
Unix 尝 试 运行 以 #! 开 头 的 可 执行 文件 时 ， 它 会 启动 #! 后 的 解释 器 ,并 将 文件 剩余 的 内 容 作 为 该 解 
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释 器 的 标准 输入 。 所 以 ， 下 例 也 是 一 个 脚本 : 


#!/usr/bin/tail -2 

This program won't print this line, 
but it will print this line... 

and this line, too. 


shell 脚 本 的 第 一 行经 常会 出 现 这 样 的 错误 : 脚本 语言 解释 器 的 路 径 无 效 。 举 个 例子 , 假设 上 
面 的 脚本 叫 作 myscript， 如 果 tail 不 在 /usr/bin 中 ， 而 在 /bin 中 ， 那 么 运行 myscript 将 会 产生 以 下 报 
错 信 息 : 


bash: ./myscript: /usr/bin/tail: bad interpreter: No such file or directory 


还 有 , 不 要 期 望 解释 器 能 接受 多 个 参数 。 上 例 的 -? 是 可 行 的 ,但 如 果 再 加 多 一 个 参数 ， 系 统 
就 会 将 -2 和 第 二 个 参数 ( 包括 空格 ) 合 为 一 个 参数 。 不同 的 系统 可 能 效果 不 一 样 ,但 最 好 还 是 别 
这 么 做 。 

下 面 来 看 一 些 具体 的 脚本 语言 。 


15.5.1 Python 


脚本 语言 Python 拥 有 一 系列 强大 的 功能 ， 如 文本 处 理 、 数 据 库 访问 、 网 络 编程 、 多 线程 等 ， 
而 且 支 持 者 众多 。 它 还 有 强大 的 交互 模式 和 一 套 有 组 织 的 对 象 模型 。 

Python 的 可 执行 程序 是 python， 通 常 在 /usr/bin 中 。 然 而 ， 它 不 仅 能 用 于 脚本 编程 ， 还 可 以 用 
作 建 站 工具 。David M. Beazley 的 Python Essential Reference, 4th edition ( Addison-Wesley, 2009 ) 
开头 有 一 段 简短 的 教程 ， 是 一 本 不 错 的 Python 参考 书 。 


15.5.2 Perl 


Perl 是 Unix 上 的 较为 老 旧 的 第 三 方 脚本 语言 之 一 。 它 是 编程 界 的 “瑞士 军刀 ”。 虽 然 近年 它 被 
Python 超越 ， 但 它 仍 是 文本 处 理 、 转 换 、 文 件 操作 的 利 咒 ， 而 且 你 会 发 现 很 多 工具 都 是 由 它 构建 
成 的 。RandalL. Schwartz、brian d foy 和 Tom Phoenix 的 Learning Perl, 6th edition ( O?Reilly，2011 ) 
可 当 作 教程 来 看 。 想 更 详细 地 了 解 Perl, 可 参考 Chromatic 的 Modern Perl( Onyx Neon Press, 2014 )。 


15.5.3 ”其 他 脚本 语言 


你 可 能 还 会 见 到 以 下 这 些 脚 本 语言 。 

口 PHP: 它 是 超 文本 处 理 语言 ， 常 用 于 动态 网 页 编程 。 也 有 些 人 只 拿 它 当 脚本 用 。 其 官网 是 

http:/www.php.net/。 

口 Ruby: 面向 对 象 的 爱好 者 和 Web 开 发 者 尤其 喜欢 这 语言 ( http://www.ruby-lang.org/ )。 

口 JavaScript: 此 语言 主要 是 在 浏览 器 中 操作 网 页 内 容 。 大 部 分 老 程序 员 都 觉得 它 缺 点 太 多 
而 不 把 它 当 作 脚 本 语言 , 不 过 对 于 Web 编 程 来 说 它 几 乎 是 必 不 可 少 的 。 它 有 一 种 实现 叫 作 
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Node.js， 可 执行 程序 是 node。 


口 Emacs Lisp: 它 是 Lisp 语 言 的 一 个 变种 ， 在 Em 


免费 软件 。 


of R Programming (No Starch Press, 2011 )。 


口 m4: 宏 处 理 语言 ， 常 见于 GNU autotools。 


口 Mathematica: 也 是 一 套 商 业 的 数学 编程 语言 和 库 


口 Tcl: Tcl (工具 命令 语言 ) 是 一 种 简单 的 脚本 语言 ， 其 扩展 有 图 形 界 面 Tk 和 自动 化 工具 


acs 文 本 编辑 器 中 使 用 。 


口 Matlab 和 Octave: Matlab 是 一 套 商 业 的 和 矩阵 及 数学 编程 语言 和 库 。Octave 是 类 似 Matlab 的 


口 R: 一 种 流行 的 免费 统计 分 析 语 言 。 详 见 http:/www.r-project.org/ 和 Norman Matloff 的 Tpe Art 


O 


Expect。 虽 然 Tcl 不 再 被 广泛 使 用 ， 但 不 要 小 看 它 的 能 力 。 很 多 经 验 丰富 的 开发 者 喜欢 用 


Tk， 尤 其 是 喜欢 用 它 做 嵌入 式 开发 。 有 关 Tk， 


15.6 Java 


详 见 http://wwwi.tcl.tk/。 


Java 跟 C 一 样 都 是 编译 型 语言 ， 它 有 更 简单 的 语法 和 强大 的 面向 对 象 能 力 。 它 在 Unix 上 也 较 
为 常用 。 例如, 它 多 用 于 制作 Web 应 用 和 一 些 特定 的 应 用 。Android 应 用 就 通常 是 用 Java 来 开发 的 。 


尽管 我 们 很 少 在 Linux 桌 面 看 到 它 , 但 你 还 是 应 该 懂得 Java 的 运作 , 至 少 是 了 解 它 如 何在 一 个 独立 


应 用 上 运作 。 


Java 编 译 器 分 为 两 种 : 用 于 生成 机 器 码 供 系 统 使 用 的 本 地 编译 器 〈 如 C 编 译 器 ) 以 及 字 方 码 
解释 器 〈《 有 时 也 叫 虚 拟 机 ， 但 不 是 第 17 章 讲 的 那 种 虚拟 机 ) 使 用 的 字 节 码 编译 器 。 你 在 Linux 上 


看 到 的 Java 程 序 都 是 字 节 码 。 


Java 字 节 码 文件 以 .class 结 尾 。Java 运 行 时 环境 (Java Runtime Environment， 以 下 简称 JRE ) 
包含 了 运行 Java 字 节 码 所 需 的 程序 。 想 运行 一 个 字 节 码 文件 ， 可 以 这 样 做 : 


$ java file.class 


以 jar 结 尾 的 字 节 码 文 件 也 是 有 的 , 它 由 一 堆 .class 文 件 打包 而 成 。 运行 jar 文 件 需要 用 这 种 语法 : 


$ java -jar file.jar 


有 时 你 可 能 需要 将 Java 的 安装 路 径 设 置 到 JAVA_HOME 环 境 变量 中 ， 甚 至 可 能 还 需要 使 
CLASSPATH 变 量 包含 你 程序 需要 的 所 有 class 的 所 在 目录 。CLASSPATH 是 一 个 以 冒号 分 隔 的 目录 集合 ， 


看 起 来 跟 可 执行 程序 所 参考 的 PATH 变量 差不多 。 


你 需要 有 Java 开 发 工具 ( Java Development Kit， 以 下 简称 JDK ) 才能 将 .java 文 件 编译 成 字 节 
人 码 。 有 了 JDK， 你 就 可 以 运行 其 中 的 javac 编 译 器 来 创建 .class 文 件 : 


$ javac file.java 


JDK 还 包含 jar 程 序 ， 它 能 创建 和 拆 分 jar 文件 ， 月 


月 法 类 似 tar。 
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15.7 展望: 编译 包 


编译 器 和 脚本 语言 的 世界 很 庞大 ,而 且 在 不 断 地 扩张 。 就 在 本 书 成 书 之 际 , 新 的 编译 型 语言 
如 Go (golang ) 和 Swift 也 已 逐渐 流行 起 来 。 

LLVM 编 译 器 设备 集 (http:/llvm.org/ ) 能 显著 地 简化 编译 器 的 开发 。 如 果 你 对 设计 和 实现 编 
译 器 有 兴趣 ， 这 两 本 书 值得 一 看 : Alfred V. Aho et al. 的 Compilers: Principles, Techniques and Tools, 
2nd edition ( Addison-Wesley, 2006 ) 和 Dick Grune et al. 的 Modern Compiler Design, 2nd edition 
( Springer，2012 )。 而 对 于 脚本 语言 ， 最 好 还 是 参考 在 线 资源 ， 因 为 脚本 语言 的 实现 五 花 八 门 。 

掌握 了 编程 工具 的 基础 , 你 就 可 以 去 看 看 它们 能 做 什么 了 。 下 一 章 讲 的 就 是 如 何 从 源 代码 构 
建 包 。 
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大 部 分 非 专利 的 第 三 方 Unix 软 件 都 是 以 源 代 码 的 形式 
放出 ， 使 人 们 能 自行 构建 并 安装 。 其 中 一 个 原因 是 ，Unix 
( 以 及 Linux ) 版 本 繁多 ， 架 构 各 异 ， 我 们 很 难 造 出 符合 各 平 
台 的 二 进 制 程序 的 组 合 包 。 另 外 ， 同 样 重要 的 是 ，Unix 社 区 
上 放出 的 各 式 各 样 的 源码 鼓励 用 户 为 漏洞 修复 和 功能 添加 
做 贡献 ， 这 使 开源 变 得 有 意义 。 


Linux 系 统 上 ， 几 乎 所 有 的 东西 都 有 它 的 源 代 码 一 一 从 内 核 、C 库 , 到 网 页 浏览 需 等 等 。 你 甚 
至 可 以 使 用 源 代 码 来 (重新 ) 安装 你 系统 的 某 部 分 , 来 更 新 和 加 强 你 的 系统 。 但是， 你 不 应 该 让 
所 有 东西 都 从 源 代 码 构建 并 安装 ， 除 非 你 真 的 很 享受 这 个 过 程 或 者 某 些 特殊 原因 使 然 。 
Linux 发 行 版 的 核心 部 分 ， 如 /bin 中 的 程序 ， 一 般 都 不 难 更 新 ， 而 且 ，Linux 的 安全 问题 通常 
都 修复 得 很 快 。 然 而 , 不 要 期 望 你 的 发 行 版 能 为 你 提供 一 切 。 以 下 这 些 原因 就 解释 了 为 何 你 需要 
自行 安装 某 些 包 。 
口 你 可 按 自己 的 需要 进行 设置 。 
口 你 可 自己 决定 安装 位 置 。 其 至 你 还 可 以 安装 同一 个 包 的 不 同 版 本 。 
口 你 可 自行 控制 版 本 。 发 行 版 不 一 定 会 自 带 所 有 包 的 最 新 版 本 ， 尤 其 是 那些 附属 的 软件 包 
(如 Python 的 库 )。 
口 你 可 了 解 该 包 如 何 运 作 。 


16.1 软件 的 构建 系统 


Linux 上 的 编程 环境 有 很 多 种 : 从 传统 的 C 语 言 到 如 Python 的 解释 型 脚本 语言 。 它 们 各 自 都 有 
至 少 一 套 区 别 于 Linux 发 行 版 自 带 工 具 的 构建 和 安装 系统 。 
我 们 这 一 章 会 讲解 如 何 通过 其 中 的 GNU autotools 套 件 所 产生 的 配置 脚本 来 编译 和 安装 C 


图 灵 社 区 会 员 小 虎 (164142021@qq.com) 专 享 尊重 版 权 


212 第 16 章 从 C 代 码 编译 出 软件 


代码 。 大 家 都 普遍 认为 这 套 系统 是 稳定 的 ， 而 且 实 际 上 很 多 基本 的 Linux 工 具 都 使 用 到 了 它 。 
因为 它 是 基于 make 等 现 有 的 工具 之 上 的 , 所 以 看 完 本 章 之 后 , 你 可 以 将 这 些 知 识 套 在 其 他 构建 
系统 上 。 

从 C 代 码 安装 一 个 软件 ， 通 常 涉及 这 些 步 又 : 

(1) 将 源 代码 的 归档 解 包 ; 

(2) 对 包 进 行 设置 ; 

(3) 运行 make 来 构建 程序 ; 

(4) 运行 make install 或 者 发 行 版 特定 的 安装 命令 来 安装 该 包 。 


注解 ”在 往 下 读 之 前 ， 你 应 该 先 弄 懂 第 15 章 讲 的 基础 知识 。 


16.2 解 开 C 源码 包 


一 个 软件 包 的 源码 包 ， 通 常 是 一 个 .tar.gz、.tar.bz2 或 .tar.xz 文 件 ， 你 需要 按照 2.18 节 的 做 法 来 
解 开 它 。 不 过 在 此 之 前 ， 还 是 先 用 tar tvf 或 tar ztvf 来 检查 下 里 面 的 内 容 ， 因 为 有 些 包 解 开 时 不 
会 建立 自己 的 目录 。 

如 果 输 出 是 这 样 ， 那 就 可 以 解 开 它 了 : 


package-1.23/Makefile.in 
package-1.23/README 
package-1.23/main.c 
package-1.23/bar.c 

-- Snip-- 


不 过 ， 它 也 有 可 能 没有 将 文件 放 在 一 个 目录 ( 如 上 例 的 package-1.23 ) 里 ， 


Makefile 
README 
main.c 
-- Snip-- 


将 上 面 这 种 包 直接 解 包 的 话 , 会 使 你 的 当前 目录 变 得 一 团 乱 。 为 了 避免 这 种 情况 ,你 要 先 创 
建 一 个 目录 , 并 cd 进去 , 再 在 里 面 进行 解 包 。 最 后 一 点 , 你 还 要 留意 那些 包含 绝对 路 径 名 的 文件 ， 
例如 这 些 : 


/etc/passwd 
/etc/inetd.conf 


中 


这 种 情况 很 少见 ， 但 如 果 你 真 的 遇 到 了 ， 请 将 该 包 删 掉 。 里 面 可 能 包含 木马 或 者 一 些 恶意 
代 人 码 [3 


日 
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从 哪里 开始 


当 你 解 包 完 ， 并 看 到 一 堆 文件 出 现时 ， 请 先 去 找 找 README 和 INSTALL 文 件 。 无 论 如 何 ， 
README 文 件 都 是 要 首先 看 的 ， 因 为 里 面 含 有 关于 该 包 的 描述 、 手 册 、 安 装 提示 ， 以 及 其 他 有 
用 的 信息 。 很 多 包 都 会 提供 INSTALL 文 件 , 里 面 是 编译 和 安装 软件 的 指令 。 请 注意 其 中 特别 的 编 
译 器 选项 和 定义 。 

除了 README 和 INSTALL ， 你 还 会 看 到 以 下 三 类 文件 。 

口 与 make 系 统 相 关 的 文件 , 例如 Makefile、Makefile.in、configure 、CMakeList.txt 等 。 有 些 旧 

的 软件 的 Makefile 可 能 需要 你 自己 去 改 , 但 现在 大 多 都 会 用 GNU autoconf 或 CMake 之 类 的 
配置 工具 。 这 些 工 具有 其 脚本 或 配置 文件 ( 如 configure 或 CMakeList.txt )， 可 根据 你 的 系 
统 设 定 和 配置 选项 来 帮 你 从 Makefile.in 中 生成 Makefile。 

口 以 .c、h 或 .cc 结尾 的 源码 文件 。 包 里 到 处 都 会 有 C 源 码 文件 。 而 C++ 源码 文件 则 通常 以 .cc、.C 

或 .cxx 结 尾 。 

口 以 .o 结 尾 的 对 象 文 件 ， 或 者 二 进 制 文件 。 一 般 来 说 ， 源 码 包 中 是 没有 对 象 文件 的 , 但 如 果 
该 包 的 维护 者 无 权 释 放 源 代码 而 只 能 提供 对 象 文 件 的 话 ， 那 你 就 要 自己 处 理 它们 了 。 大 
多 数 情况 下 ， 源 码 包 里 含有 对 象 文件 (或 可 执行 的 二 进 制 文件 )， 就 意味 着 该 软件 打包 有 
问题 ， 你 需要 运行 make clean 来 进行 全 新 的 编译 。 


16.3 GNU autoconf 


虽然 C 代 码 一 般 都 是 可 移植 的 ， 但 我 们 还 是 难以 只 靠 一 个 Makefile 来 适应 各 平台 的 差异 。 早 
期 的 解决 方法 是 为 不 同 的 操作 系统 提供 不 同 的 Makefile ， 或 者 是 提供 一 个 易于 修改 的 Makefile。 
这 种 做 法 后 来 演变 成 了 使 用 脚本 来 分 析 系 统 (这 种 分 析 以 往 只 用 于 构建 软件 包 )， 再 产生 出 
Makefile。 

GNU autoconf 就 是 一 套 流 行 的 、 用 于 自动 产生 Makefile 的 系统 。 使 用 此 套 系统 的 包 都 会 带 有 
configure、Makefile.in 和 config.h.in 文 件 。 其 中 .ip 文件 是 模板 。 它 的 做 法 是 , 运行 configure 脚 本 来 
分 析 你 系统 的 特性 , 然后 在 .in 文 件 的 基础 上 做 一 些 蔡 换 , 最 后 创建 出 真正 的 构建 文件 。 对 于 终端 
用 户 来 说 ， 这 个 过 程 是 简单 的 ， 只 需要 像 下 面 这 样 执行 configure 就 能 从 Makefile.in 产 生出 
Makefile: 


$ ./configure 


因为 该 脚本 会 先 检查 你 的 系统 ， 所 以 它 会 输出 一 大 堆 诊 断 信息 。 如 果 一 切 正 常 ，configure 
就 会 创建 出 一 个 或 多 个 Makefile、 一 个 config.h 文 件 以 及 一 个 缓存 文件 config.cache。 绥 存 文件 能 使 
你 下 次 configure 时 不 必 再 做 一 次 系统 检查 。 

现在 你 可 以 运行 make 来 编译 那个 包 了 。 虽 然 configure 成 功 不 代表 make 也 能 成 功 , 但 它 作 为 第 
一 步 来 说 还 是 很 重要 的 。( 有 关 configure 和 编译 失败 的 问题 查找 ， 见 16.6 节 。) 


图 灵 社 区 会 员 小 虎 (164142021@qq.com) 专 享 尊重 版 权 


274 第 16 章 从 C 代 码 编译 出 软件 


下 面 来 亲自 体验 下 这 个 过 程 吧 。 


注解 ”现在 你 需要 集 齐 一 些 必要 的 构建 工具 。 对 于 Debian 和 Ubuntu 来 说 ， 最 简单 的 做 法 就 是 安 
装 build-essential 包 ; 而 对 于 类 Fedora 系 统 ， 请 用 第 15 章 的 开发 工具 groupinstall。 


16.3.1 一 个 autoconf 的 例子 


在 讨论 自 定义 autoconf 的 行为 之 前 ， 我 们 先 看 一 个 普通 的 例子 ， 这 样 你 才 知 道 你 想 要 自 定义 
的 是 什么 。 你 需要 先 把 GNU coreutils 包 安装 在 自己 的 root 目 录 里 〈 以 确保 不 会 影响 整个 系统 )。 该 
包 可 在 http:/ftp.gnu.org/gnu/coreutils/ (通常 最 新 的 就 是 最 好 的 ) 获取 ， 然 后 解 开 它 ， 进 入 它 的 目 
录 中 ， 进 行 以 下 配置 


Ce 


$ ./configure --prefix=$HOME/mycoreutils 

checking for a BSD-compatible install... /usr/bin/install -c 
checking whether build environment is sane... yes 

-- Snip-- 

config.status: executing po-directories commands 
config.status: creating po/POTFILES 

config.status: creating po/Makefile 


接着 make 它 : 
$ make 
GEN lib/alloca.h 
GEN lib/c++defs.h 
-- Snip-- 


make[2]: Leaving directory '/home/juser/coreutils-8.22/gnulib-tests' 
make[1]: Leaving directory '/home/juser/coreutils-8.22" 


下 一 步 试 着 运行 某 个 刚刚 创建 出 的 可 执行 文件 ， 如 ./src/ls， 再 试 着 运行 make check， 来 对 该 
包 进 行 一 系列 的 检查 。( 这 会 花 一 些 时 间 ， 但 是 很 有 趣 。) 
最 后 ， 可 以 安装 该 包 了 。 先 用 -n 选 项 空 跑 一 次 ， 看 看 它 准备 安 装 些 什么 : 


$ make -n install 


检查 一 下 输出 , 如 果 没 有 什么 异常 (例如 它 准备 安装 在 mycoreutils 以 外 的 地 方 ), 就 实施 安装 : 


$ make install 


现在 你 root 目 录 里 应 该 有 一 个 子 目录 叫 mycoreutils ， 里 面 应 该 有 了 bin 、share 等 子 目 录 。 看 看 
bin 里 的 那些 程序 ( 你 刚刚 建 好 了 第 2 章 里 提 到 的 很 多 基本 工具 )。 最 后 一 点 ， 因 为 你 将 mycoreutils 
放 在 了 你 的 root 目 录 下 ， 它 与 你 系统 的 其 他 部 分 独立 了 开 来 ， 所 以 你 可 随意 将 其 删 掉 ， 而 不 用 担 
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心 对 系统 造成 损害 。 


16.3.2 ”使 用 打包 工具 来 安装 


大 部 分 Linux 发 行 版 都 带 有 软件 打包 工具 ， 它 创建 出 的 安装 包 能 对 由 该 包 安 装 的 软件 进行 后 
期 维护 。 基 于 Debian 的 发 行 版 (如 Ubuntu ) 或 许 是 最 简单 的 ， 就 像 下 面 这 样 ， 使 用 checkinstal1， 
而 不 单 是 使 用 make install: 


# checkinstall make install 


你 可 以 用 --pkgname=name 选 项 来 指定 新 包 的 名 称 。 
创建 RPM 包 会 更 复杂 一 点 ， 因 为 你 得 先 创建 一 个 目录 树 以 便 制 作 包 。 你 可 以 使 用 rpmdev- 
setuptree 命 令 来 实现 ,然后 再 用 rpmbuild 工 具 来 完成 剩 下 的 工作 。 最 好 还 是 按照 网 上 的 教程 来 做 。 


16.3.3 ”configure 脚 本 的 选项 


刚才 你 已 看 到 了 configure 脚 本 最 有 用 的 选项 之 一 : 使 用 --prefix 来 指定 安装 位 置 。autoconf 
默认 生成 的 Makefile 中 的 install 目 标 都 是 使 用 /usr/local 作 为 前 级 : 二 进 制 程序 会 去 到 
/usrlocalbin ， 库 会 去 到 /srlocaylib ， 等 等 。 更 改 前 绥 可 执行 如 下 命令 : 


$ ./configure --prefix=new prefix 


configure 的 大 多 数 版 本 都 有 --help 选 项 ,可 以 列 出 其 他 配置 选项 。 不幸 的 是 , 该 列表 实在 太 

长 了 ,难以 得 知 哪些 是 重点 。 以 下 我 们 特地 列举 了 一 些 必要 的 选项 。 

口 --bindir=directory: 将 可 执行 程序 装 在 directory 目 录 。 

口 --sbindir=directory: 将 系统 级 的 可 执行 程序 装 在 directory 目 录 。 

口 --libdir=directory: 将 库 装 在 directory 目 录 。 

口 --disable-shared: 不 构建 共享 库 (要 看 具体 是 什么 库 )。 不 构建 的 话 ， 或 许 能 避免 一 些 

后 续 的 麻烦 。( 详 见 15.1.4 节 。 ) 

口 --with-package=directory: 告诉 configure 需 要 用 到 directory 目 录 的 包 。 当 某 个 库 不 在 标 
准 位 置 时 ， 这 个 选项 是 比较 好 用 的 。 但 不 幸 的 是 ， 并 非 所 有 的 configure 脚 本 都 能 识别 这 
个 选项 ， 而 且 ， 它 的 语法 不 明确 。 

使 用 不 同 的 构建 目录 
如 果 你 想 试 试 上 述 这 些 选 项 的 话 , 你 可 以 在 用 男 一 个 目录 构建 时 进行 尝试 。 首先 在 任意 一 个 

地 方 新 建 一 个 日 录 , 然后 在 新 目录 运行 原 目录 的 configure 肢 本。 这样 所 产生 的 Makefile 将 会 依然 

使 用 原 目录 的 源码 ， 但 make 出 的 东西 却 留 在 新 目录 。( 有 些 开发 者 更 希望 你 这 么 做 ， 因 为 这 样 不 

仅 不 会 在 原 目录 产生 新 的 东西 , 而 且 还 有 利于 使 用 相同 的 源码 为 不 同 平台 或 使 用 不 同 配置 选项 进 

行 构建 。) 
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16.3.4 “环境 变量 


你 可 以 通过 修改 一 些 会 被 configure 脚 本 当成 make 变 量 的 环境 变量 来 影响 configure 的 行为 。 
最 重要 的 环境 变量 是 CPPFLAGS 、CFLAGS 和 LDFLAGS。 但 要 小 心 的 是 ，configure 对 环境 变量 是 很 挑 
剔 的 。 比 如 说 ， 对 于 头 文 件 目录 ， 你 应 该 使 用 CPPFLAGS 而 不 是 CFLAGS， 因 为 configure 经 常会 单独 
运行 预 处 理 器 。 

在 bash 中 , 为 configure 设 置 环境 变量 的 最 简单 的 做 法 就 是 在 ./configure 前 放置 变量 的 声明 。 
例如 ， 以 下 命令 就 为 预 处 理 器 定义 了 宏 DEBUG: 


$ CPPFLAGS=-DDEBUG ./configure 


注解 ”你 也 可 以 用 选项 的 形式 来 传递 变量 ， 例 如 : 


$ ./configure CPPFLAGS=-DDEBUG 


使 用 环境 变量 来 指引 configure 查 找 第 三 方 include 文 件 和 库 也 是 很 方便 的 。 例 如 ， 以 下 命令 
会 使 预 处 理 器 到 include_ dir 里 查找 


$ CPPFLAGS=-Iinclude dir ./configure 


如 15.2.6 节 所 讲 ， 要 使 连接 器 到 lib_dir 里 查找 ， 可 用 此 命令 : 


$ LDFLAGS=-L1ib dir ./configure 


如 果 要 用 到 lib_dir 的 共享 库 ( 见 15.1.4 节 )， 那 么 上 例 是 设置 不 了 运行 时 动态 连接 的 。 你 还 需 
要 用 到 连接 器 的 -rpath 选 项 : 


$ LDFLAGS="-L1ib dir -Wl, -rpath=1ib dir" ./configure 


设置 变量 时 要 谨慎 。 一 点 差错 就 会 使 configure 失 败 。 比 如 ,假设 你 的 -I 写 少 了 一 杠 , 像 下 
面 这 样 : 


$ CPPFLAGS=Iinclude dir ./configure 


就 会 产生 这 样 的 报错 : 


configure: error: C compiler cannot create executables 
See 'config.log' for more details 


查看 这 次 失败 所 产 出 的 config.log， 你 会 发 现下 列 信息 : 
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configure:5037: checking whether the C compiler works 
configure:5059: gcc Iinclude dir conftest.c >&5 
gcc: error: Iinclude dir: No such file or directory 
configure:5063: $? = 1 

configure:5101: result: no 


16.3.5 ”autoconf 的 目标 


若 configure 成 功 执 行 ， 你 会 发 现 它 所 生成 的 Makefile 里 除了 有 标准 的 al1 和 install， 还 包含 
如 下 所 列 的 一 些 有 用 的 目标 。 
口 make clean: 如 第 15 章 所 述 ， 它 会 清除 所 有 对 象 文 件 、 可 执行 程序 和 库 。 
口 make distclean: 它 与 make clean 很 像 ， 只 不 过 它 清除 的 是 所 有 自动 产生 的 东西 ， 包 括 
Makefile 、config.h、config.log 等 等 。 也 就 是 说 ， 它 使 整个 源码 目录 就 像 刚 解 包 出 来 一 样 。 
口 make check: 有 些 包 会 自 带 一 些 用 于 检查 所 编译 出 的 程序 是 否 正确 的 测验 ; 而 make check 


OO 


口 make install-strip: 它 与 make install 很 像 ， 只 不 过 是 在 安装 时 ， 它 会 将 可 执行 程序 和 
库 内 的 符号 表 及 其 他 调试 信息 都 移 除 掉 。 移 除 之 后 ,程序 占 的 空间 会 少 很 多 。 


16.3.6 ”autoconf 的 日 志文 件 


如 果 configure 的 执行 过 程 出 了 错 , 但 你 却 看 不 出 哪里 有 错 ， 那么 你 可 以 检查 一 下 config.log。 
不 幸 的 是 ，config.log 通 常 是 很 大 的 ， 不 容易 定位 问题 的 根源 。 

一 般 的 做 法 是 去 到 config.log 的 底部 ( 比如 在 less 里 按 G 键 )， 然 后 不 断 往 上 翻 页 ， 直 到 看 见 
问题 。 然 而 ， 这 也 是 很 麻烦 的 ， 因 为 configure 会 将 所 有 环境 信息 包括 输出 变量 、 缓 存 变量 和 其 
他 定义 都 写 在 那里 。 所 以 ， 与 其 从 底部 往 上 翻 页 ， 不 如 从 底部 往 上 搜索 “for more details” 之 类 
的 字符 串 ， 或 configure 报 错 的 内 容 。( 记 住 ， 你 可 在 less 中 使 用 ?命令 来 发 起 反 向 搜索 。 ) 很 有 可 
能 错误 就 在 你 搜 到 的 内 容 中 。 


16.3.7 pkg-config 


第 三 方 的 库 有 很 多 ， 如 果 都 放 在 同一 个 地 方 , 那 会 显得 很 乱 。 但 是 ， 如 果 各 自 放 在 单独 的 地 
方 ， 那么 在 连接 时 又 会 出 现 麻 烦 。 例 如 ， 假 设 你 要 编译 OpenSSH， 它 需要 用 到 OpenSSL 库 ， 那 么 
你 该 怎样 将 OpenSSL 库 的 位 置 告知 OpenSSH 的 configure 呢 ? 

现在 很 多 库 都 用 pkg-config 来 解决 问题 ， 它 不 仅 可 以 公告 include 文 件 和 库 的 位 置 ， 还 可 以 用 
于 明确 指定 编译 和 连接 的 选项 。 其 语法 如 下 : 


$ pkg-config options package1 package2 ... 


例如 ， 查 找 OpneSSL 所 需 的 库 ， 可 用 以 下 命令 : 


$ pkg-config --libs openssl 
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其 输出 大 概 是 这 样 : 


-lssl -lcrypto 


想 查 看 pkg_config 所 知 的 全 部 库 ， 用 以 下 个 


个 
少 


$ pkg-config --list-all 


pkg-config 的 运作 方式 
探究 其 内 幕 ， 你 会 发 现 pkg_config 是 通过 读 取 .pc 配置 文件 来 获取 包 信息 的 。 例 如 ， 以 下 是 
Ubuntu 中 OpenSSL 套 接 字 库 的 openssl.pc ( 在 /usr/lib/i1386-linux-gnu/pkgconfig 中 ): 


prefix=/usr 

exec prefix=${prefix} 

libdir=${exec prefix}/1ib/i386-linux-gnu 
includedir=${prefix}/include 


Name: OpenSSL 

Description: Secure Sockets Layer and cryptography libraries and tools 
Version: 1.0.1 

Requires: 

Libs: -L${libdir} -lssl -lcrypto 

Libs.private: -ldl -1z 

Cflags: -I${includedir} exec prefix=${prefix} 


你 可 以 修改 这 个 文件 ， 例 如 ， 给 库 选 项 增加 -Wl1,-rpath=${1libdir}， 以 指定 运行 时 动态 连接 
的 路 径 。 但 一 个 问题 是 ，pkg-config 是 怎么 找到 .pc 文件 的 呢 ? 默认 地 ，pkg-config 会 在 其 安装 位 
置 前 级 的 lib/pkgconfig 目 录 里 找 。 例 如 ， 如 果 安 装 位 置 前 级 是 /usr/local ， 那 么 它 就 会 去 
/usr/local/lib/pkgconfig 里 找 。 

使 用 标准 位 置 以 外 的 pkg-config 文 件 

不 幸 的 是 , pkg-config 不 会 在 标准 位 置 以 外 的 地 方 查找 .pc 文件 。 如 果 一 个 .pc 文件 的 所 在 位 置 
不 标准 ， 如 /opt/openssl/lib/pkgconfig/openssl.pc， 那 么 常规 安装 的 pkg-config 是 不 会 读 取 到 它 的 。 
以 下 是 两 个 基本 的 解决 方法 。 
口 将 .pc 文件 的 符号 链接 ( 或 副本 ) 集中 到 pkgconfig 目 录 中 。 
口 使 环境 变量 PKG_CONFIG_PATH 包 含 那 些 另 外 的 pkgconfig 目 录 。 环 境 变量 只 在 本 shell 及 子 

shell 内 有 效 。 


16.4 ”实践 安装 


知道 如 何 构建 和 安装 软件 固然 很 好 ， 但 更 重要 的 是 知道 在 何 时 与 何 处 安装 自己 的 软件 。Linux 
发 行 版 本 身 就 带 有 很 多 软件 ,不 过 你 最 好 看 下 是 否 你 自己 安装 会 更 好 ,以 下 是 自行 安装 的 一 些 好 处 。 
口 你 可 以 进行 一 些 自 定 义 设置 。 
口 手动 安装 的 话 ， 会 更 好 地 理解 该 软件 的 用 法 。 
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口 想 装 什么 版 ， 就 装 什么 版 。 
口 能 更 方便 地 对 定制 过 的 软件 包 进 行 备份 。 
口 能 更 方便 地 通过 网 络 分 享 定制 过 的 软件 包 〈 只 要 其 架构 是 一 致 的 且 安 装 位 置 是 相对 独立 
的 )。 
以 下 是 坏处 。 
口 这 样 比较 花 时 间 。 
口 自行 安装 的 软件 包 不 会 自动 更 新 。 发 行 版 能 毫 不 费力 地 管理 软件 的 自动 更 新 。 网 络 应 用 
的 安全 更 新 尤其 重要 。 
口 如 果 你 不 用 该 软件 ， 那 么 安装 它 只 是 浪费 时 间 。 
口 有 可 能 装 错 。 
就 如 早 前 构建 coreutils (1s 、cat 等 ) 时 所 见 ， 安 装 软 件 没有 多 少 难 点 ， 除 非 你 定制 得 太 多 。 
不 过 ， 如 有 果 你 对 网 络 服务 器 如 Apache 很 有 兴趣 ， 想 完全 掌控 ， 那 最 好 就 是 自行 安装 了 。 


在 哪里 安装 


GNU autoconf 及 很 多 其 他 软件 包 的 默认 前 绥 都 是 /uswlocal， 它 是 本 地 安装 软件 的 传统 位 置 。 
操作 系统 不 会 更 新 srlocal 里 的 软件 ， 所 以 自动 更 新 不 会 使 你 那里 的 东西 丢失 。 不 过 如 果 你 自 
行 安装 的 软件 太 多 ， 那 就 会 导致 混乱 。 里 面 成 千 上 万 的 零散 文件 ， 会 使 你 无 法 理 清 它们 各 自 属 
于 哪里 。 

如 果 情 况 真 的 变 得 很 糟糕 ， 那 么 你 就 应 该 按 16.3.2 节 所 述 来 创建 自己 的 软件 包 了 。 


16.5 打 补 丁 


现在 大 多 数 的 软件 源码 修改 都 可 以 通过 在 线 版 本 库 ( 如 git 库 ) 的 分 支 功 能 实现 。 但 我 们 偶尔 
还 是 会 遇 到 打 补 丁 的 做 法 ， 即 使 用 补丁 文件 来 修复 漏洞 和 增加 功能 。 你 可 能 还 听 说 过 有 人 将 di 位 
等 同 于 补丁 文件 ， 因 为 补丁 文件 是 由 diff 程 序 产生 的 。 

补丁 文件 的 开头 类 似 这 样 : 


-- src/file.c.orig 2015-07-17 14:29:12.000000000 +0100 
+++ SrC/file.c 2015-09-18 10:22:17.000000000 +0100 
@@ -2,16 +2,12 @@ 


补丁 里 所 记录 的 改动 可 以 来 自 多 个 文件 。 你 可 以 在 补丁 里 搜索 “三 杠 ”( --- ) 来 得 知 修改 了 哪 
些 文件 。 你 还 应 注意 补丁 开头 所 示 的 工作 目录 。 如 上 例 所 指 的 是 src/file.c， 所 以 你 应 该 在 执行 补 
丁 之 前 先 去 到 含有 src 目 录 的 目录 ， 而 非 去 到 src 目 录 。 

打 补 丁 要 用 到 patch 命 令 : 


$ patch -po < patch file 
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如 果 一 切 顺利 ，patch 就 会 将 文件 都 更 新 好 ， 并 正常 退出 。 不 过 ， 如 果 出 现 这 样 的 提示 : 


File to patch: 


mm 


那 就 很 可 能 是 你 进 错 了 目录 , 或 者 是 该 目录 里 的 源码 与 补丁 文件 里 的 不 匹配 。 这 就 有 点 束 好 
了 : 它 可 能 会 导致 有 些 代码 更 新 了 ， 有 些 没 更 新 ， 使 得 接 下 来 的 编译 不 成 功 。 
有 时 你 可 能 会 遇 到 这 种 情况 : 


--- package-3.42/src/file.c.orig 2015-07-17 14:29:12.000000000 +0100 
+++ package-3.42/src/file.c 2015-09-18 10:22:17.000000000 +0100 


第 一 个 目录 。 比 如 说 ， 你 现在 处 于 一 个 含有 src 目 录 的 目录 之 中 ,但 该 目录 不 叫 package-3.42， 那 
你 可 以 用 -pi 来 忽略 这 个 开头 的 目录 名 : 


$ patch -p1 < patch file 


16.6 ”编译 和 安装 的 问题 排查 


如 果 你 懂得 区 分 编译 带 错 误 、 编 译 带 警告 、 连 接 屁 错误 和 共享 库 问 题 , 那 你 应 该 能 应 付 构 建 
软件 时 出 现 的 很 多 问题 。 本 市 会 介绍 一 些 常 见 的 问题 。 虽 然 用 autoconf 的 话 是 不 太 可 能 遇 到 这 些 
问题 的 , 但 了 解 一 下 也 无 妨 。 

在 进入 细节 之 前 ， 先 确认 自己 能 读 懂 几 种 make 输 出 。 学 会 区 分 错误 与 被 忽略 的 错误 是 很 重要 
的 。 以 下 就 是 一 个 需要 你 检查 的 真正 的 错误 : 


make: *** [target] Error 1 


然而 , 有 些 错 误 提 示 则 是 Makefile 怀 疑 出 错 了 , 但 即使 出 错 也 无 害 。 像 这 类 提示 你 可 以 忽略 : 


make: *** [target] Error 1 (ignored) 


还 有 ,大 型 的 包 中 经 常会 出 现 GNUmake 多 次 调用 自身 的 情况 。 这 时 ， 每 次 make 都 会 带 有 一 个 
[N]， 其 中 NN 是 个 数字 。 通 常 你 能 够 很 快 地 在 编译 出 错 的 提示 中 找到 错误 所 在 ， 例 如 : 


[comiler error message involving file.c] 

make[3]: *** [file.o] Error 1 

make[3]: Leaving directory '/home/src/package-5.0/src' 
make[2]: *** [all] Error 2 

make[2]: Leaving directory '/home/src/package-5.0/src' 
[1]: *** [all-recursive] Error 1 

make[1]: Leaving directory '/home/src/package-5.0/" 
make: *** [all] Error 2 
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前 三 行 就 能 告诉 你 问题 出 在 /home/src/package-5.0/src 的 file.c。 但 麻烦 的 是 ， 还 有 很 多 其 他 输 
出 信息 ， 使 我 们 难以 发 现 重 点 。 所 以 ， 学 会 过 滤 以 下 所 列举 的 make 错 误 ， 能 极 大 地 帮助 我 们 发 掘 
真正 的 问题 。 


具体 错误 
以 下 列举 了 一 些 你 可 能 会 遇 到 的 常见 构建 错误 及 其 解释 与 修复 途径 。 
问题 


编译 避 错 误 信息 : 


STC.C:22: conflicting types for 'item 
/usr/include/ file.h:47: previous declaration of 'item 


解释 与 修复 

src.c 的 第 22 行 有 对 item 的 重复 声明 。 你 将 该 行 移 除 ( 使 用 注释 、 扩 fdef 等 等 )， 即 可 修复 。 
问题 

编译 需 错 误 信 息 : 


SsTC.C:37: 'time t' undeclared (first use this function) 
-- Snip-- 
SIC.C:37: parse error before ' 


解释 与 修复 
缺少 必要 的 头 文件 。 最 好 是 从 帮助 手册 去 获知 需要 什么 头 文 件 。 首先, 看 看 出 错 的 那 行 (本 
例 中 是 src.c 的 第 37 行 )。 它 可 能 会 是 一 个 变量 的 声明 ， 类 似 这 样 的 : 


time t v1; 


向 下 搜索 v1， 看 它 是 怎么 与 函数 一 起 使 用 的 ， 例 如 : 


v1 = time(NULL); 


现在 执行 han 2 time 或 man 3 time， 查 找 名 为 time() 的 系统 调用 和 库 调用 。 于 是 ， 在 手册 2 中 
你 找到 了 你 所 需要 的 内 容 ， 如 下 所 示 : 


SYNOPSIS 
#include <time.h> 


time t time(time t *t); 


这 意味 着 time() 需 要 time.h。 所 以 ， 请 把 #include <time.h> 置 于 src.c 的 开头 ， 再 编译 一 次 。 
问题 
编译 器 ( 预 处 理 器 ) 错误 信息 : 
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STC.C:4: pkg.h: No such file or directory 
(long list of errors follows) 


解释 与 修复 
编译 回 对 src.c 运 行 C 预 处 理 器 时 ， 找 不 到 include 文 件 pkg.h。 可 能 是 有 个 库 没 安装 好 ， 或 者 


include 文 件 在 非常 规 位 置 ， 需 要 你 指明 。 通 常 ， 你 只 需要 为 预 处 理 需 选项 ( CPPFLAGS ) 加 上 -I 这 
一 include 路 径 选 项 。( 你 可 能 还 需要 一 个 连接 器 选项 -L。) 

如 果 出 错 原因 不 是 找 不 到 库 , 那 还 有 一 种 可 能 ， 即 该 操作 系统 不 支持 这 个 代码 。 你 可 以 查看 
一 下 Makefile 和 README 中 关于 平台 的 要 求 。 

如 果 你 的 发 行 版 是 基于 Debian 的 ， 试 试用 apt-file 命 令 来 查找 头 文件 : 


$ apt-file search pkg.h 


它 可 能 会 帮 你 找到 该 包 的 开发 版 。 而 对 于 有 yum 的 系统 ， 则 可 以 这 样 做 : 


$ yum provides */pkg.h 


问题 
make 错 误 信 息 : 


make: prog: Command not found 


解释 与 修复 

你 要 有 prog 程 序 才 能 构建 该 软件 。 如 果 prog 是 cc、gcc 或 1d 之 类 ， 那 就 说 明 你 系统 上 没有 安装 
开发 工具 。 而 如 果 你 觉得 你 已 安装 了 ， 那 就 试 试 在 Makefile 中 指明 prog 的 完整 路 径 。 

还 有 一 种 不 常见 的 情况 是 make 即 时 构建 并 使 用 prog。 如 果 你 的 $PATH 包 含 当前 目录 (. ) 的 话 ， 
那 这 是 可 以 做 到 的 。 而 如 果 你 的 $PATH 不 包含 当前 目录 ， 你 可 以 将 Makefile 的 prog 改 成 /prog， 或 
者 暂时 将 .加 到 $PATH 中 。 


16.7 ”前瞻 


至 此 我 们 讲解 的 还 只 是 软件 构建 的 基础 。 当 你 上 手 后 ， 可 继续 探索 以 下 话题 。 

口 学 习 autoconf 以 外 的 构建 系统 ， 如 CMake 和 SCons。 

口 为 自己 的 软件 打造 一 套 构建 系统 。 如 果 你 在 写 软件 ， 那 你 就 需要 挑选 一 套 构 建 系统 ， 并 
学 会 使 用 它 。 如 果 选 择 GNU autoconf 的 话 ， 可 参考 John Calcote 的 著作 Autotools ( No Starch 
Press，2010)。 

口 编译 Linux 内 核 。 内 核 的 构建 系统 与 别 的 工具 完全 不 同 。 它 有 一 套 方便 你 定制 内 核 与 模块 
的 配置 系统 。 不 过 ， 其 过 程 是 明了 的 ， 而 且 ， 如 果 你 理解 引导 装载 程序 的 运作 ， 那 应 该 
不 难 做 到 。 然 而 ， 编 译 内 核 还 是 要 小 心 ， 要 确保 留 有 旧 的 内 核 ， 以 防 新 的 开 不 了 机 。 
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口 发 行 版 专 有 的 源码 包 。Linux 发 行 版 会 各 自持 有 软件 源码 作为 其 特殊 的 源码 包 。 有 时 你 可 
从 它们 那里 获得 功能 扩展 或 漏洞 修复 的 补丁 。 这 些 源码 管理 系统 都 包含 了 自动 构建 的 工 
具 ， 例 如 Debian 有 debuild，RPM 有 mock。 
构建 软件 是 学 习 编 程 和 软件 开发 的 基础 。 刚 讲 完 的 这 两 章 内 容 揭 示 了 你 系统 中 软件 的 来 源 。 
下 一 步 你 应 该 可 以 很 轻松 地 查看 源码 、 修 改 源码 ， 并 制作 出 属于 自己 的 软件 。 
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之 前 的 章节 已 经 介绍 过 了 Linux 系 统 的 各 个 基础 组 件 ， 
从 底层 的 内 核 和 进程 组 织 到 网 络 ， 再 到 一 些 构建 软件 的 工 
具 。 学 完 这 些 以 后 ， 你 能 做 什么 呢 ? 实际 上 ， 可 以 做 很 多 东 
西 。 因 为 Linux 几 乎 支持 所 有 非 专利 的 编程 环境 ， 所 以 可 运 
行 的 应 用 程序 自然 种 类 繁多 。 下 面 来 了 解 一 下 Linux 擅 长 的 
一 些 应 用 领域 ， 并 看 看 你 从 本 书 学 到 的 知识 是 如 何 联系 起 来 的 。 


17.1 Web 服务 器 与 应 用 


Linux 和 党 用 于 运行 Web 服 务 器 ， 而 Linux 上 的 应 用 服务 器 之 王 是 Apache HTTP Server ( 简称 
Apache )。 男 外 还 有 一 个 你 会 经 常 听 说 的 ， 就 是 Tomcat ( 也 来 自 Apache 项 目 )， 它 能 支持 基于 Java 
的 应 用 。 

Web 服 务 器 本 身 做 的 事情 不 多 一 一 就 是 提供 文件 服务 。Apache 等 大 多 数 Web 服 务 器 的 目标 都 
是 为 Web 应 用 提供 底层 平台 。 例 如 ，Wikipedia 是 来 自 MediaWiki 包 的 ， 它 能 让 你 建立 自己 的 wiki。 
而 Wordpress 和 Drupal 之 类 的 内 容 管理 系统 则 可 以 让 你 建立 自己 的 博客 和 媒体 网 站 。 构建 这 些 应 用 
的 编程 语言 都 能 在 Linux 上 使 用 。 例 如 ，MediaWiki、Wordpress 和 Drupal 都 是 用 PHP 编 写 的 。 

这 些 Web 应 用 的 每 一 部 分 都 是 高 度 模块 化 的 。 你 可 以 方便 地 添加 自己 的 扩展 ， 并且 还 可 以 通 
过 Django、Flask 和 Rails 之 类 的 框架 来 创建 自己 的 应 用 , 它们 能 助 你 轻松 地 做 出 通用 的 Web 基 础 设 
施 和 功能 ， 例 如 模板 、 多 用 户 、 数 据 库 支持 等 。 

要 让 Web 服 务 器 正常 发 挥 ， 你 必须 先 有 坚实 的 操作 系统 作为 基础 。 在 这 方面 ， 第 8 章 到 第 10 
章 的 知识 尤其 重要 。 你 的 网 络 配置 必须 是 无 懈 可 击 的 ,但 更 重要 的 是 ， 你 要 懂得 资源 管理 。 大 小 
适当 、 性 能 优越 的 内 存 和 磁盘 是 必要 元 素 ， 特 别 是 在 你 的 应 用 需要 搭配 数据 库 的 时 候 。 
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17.2 ”数据 库 


数据 库 是 存储 和 查阅 数据 的 专业 工具 ， 而 Linux 上 可 用 的 数据 库 有 很 多 种 。 数 据 库 受 人 喜爱 
的 地 方 有 两 点 : 它 管 理 数据 的 方式 简单 统一 ， 而 且 操 作 高 效 。 

有 了 数据 库 ， 查询 和 修改 数据 变 得 更 方便 ， 尤 其 是 相对 于 文本 解析 和 修改 来 说 。 例如， 在 网 
络 上 使 用 /etc/passwd 和 /etc/shadow 是 很 麻烦 的 。 解 决 方法 是 ， 你 可 以 建立 一 个 提供 用 户 信 息 的 
LDAP ( Lightweight Directory Access Protocol， 轻 量 目录 访问 协议 ) 数据 库 来 支持 Linux 的 认证 系 
统 。 客 户 端的 配置 是 很 简单 的 ， 你 只 需 编辑 一 下 /etc/nsswitch.conf 文 件 并 加 一 些 额外 的 配置 即 可 。 
数据 库 之 所 以 能 高 效 地 读 取 数据 ,是 因为 它 采用 索引 来 记录 数据 的 位 置 。 比 如 你 有 一 堆 数 据 ， 
里 面 是 姓 、 名 、 电 话 号 码 的 对 应 关系 。 你 可 以 在 任意 属性 ( 比如 姓 ) 上 建立 索引 ,然后 ， 当 你 要 
按 姓 来 查找 一 个 人 的 时 候 , 数据 库 一 般 就 会 先 从 索引 那里 筛选 出 正确 的 位 置 , 而 非 直 接 遍 历 整 个 
数据 集 。 


数据 库 的 种 类 


数据 库 有 两 种 基本 形式 : 关系 型 和 非 关 系 型。 关系 型 数据 库 (也 叫 关系 型 数据 库 管 理 系统 ， 
或 简称 RDBMS ) 如 MySQL 、PostgreSQL 、Oracle 和 MariaDB 都 是 能 将 不 同 的 数据 连接 在 一 起 的 
多 功能 数据 库 。 举 个 例子 ， 你 有 两 组 数据 ， 一 组 是 邮编 和 人 名 ， 另 一 组 是 邮编 和 对 应 的 州 名 。 
关系 型 数据 库 能 快速 帮 你 查 出 某 个 州 的 所 有 人 名 。 我 们 一 般 用 SQL ( 结构 化 查询 语言 ) 来 跟 数 
据 库 沟 通 。 

非 关系 型 数据 库 , 有 时 也 叫 NoSQL 数 据 库 , 是 用 于 解决 关系 型 数据 库 难以 处 理 的 问题 。 例 如， 
文档 存储 型 数据 库 ( 如 MongoDB ) 用 于 简化 整个 文档 的 存储 和 索引 的 建立 。 键 值 数据 库 ( 如 redis ) 
则 关注 存 取 性 能 问题 。NoSQL 数 据 库 没有 像 SQL 这 样 的 通用 查询 语言 而 是 需要 通过 各 种 各 样 的 
接口 和 命令 来 实现 沟通 。 

第 8 章 谈 到 的 硬盘 和 内 存 性 能 问题 对 于 大 部 分 的 数据 库 实 现 来 说 都 是 非常 重要 的 ， 因 为 你 需 
要 权衡 RAM (RAM 的 存 取 更 快速 ) 和 硬盘 各 要 存储 多 少数 据 。 很 多 大 型 数据 库 系统 还 涉及 网 络 
问题 ， 因 为 它 可 能 分 布 在 多 个 服务 器 上 。 最 常见 的 网 络 装置 就 是 复制 (replication )， 其 做 法 就 是 
将 一 个 数据 库 复 制 到 多 个 服务 器 上 ， 使 该 系统 能 够 接受 更 多 的 客户 端 连接 。 


17.3 ”虚拟 化 


在 大 部 分 的 组 织 中 , 给 某 套 硬件 分 配 特 定 的 任务 是 不 划算 的 。 把 针对 某 件 任 务 而 定制 的 操作 
系统 安装 到 一 台 服 务 器 上 , 会 使 得 该 服务 器 难以 支持 其 他 任务 , 除非 你 重新 安装 其 他 系统 。 而 虚 
拟 机 技术 则 可 以 支持 在 同一 套 硬件 上 安装 多 于 一 个 操作 系统 被 称 为 来 宾 )， 并 能 让 你 随心 所 欲 
地 启动 和 关闭 它们 。 你 甚至 还 可 以 把 一 个 虚拟 机 从 一 台 机 器 复制 到 另 一 台 机 器 上 。 

Linux 可 用 的 虚拟 机 有 很 多 ， 如 内 核 的 KVM ( 内 核 虚拟 机 ) 和 Xen。 虚 拟 机 能 方便 Web 服 务 
器 和 数据 库 服务 器 的 管理 。 虽 然 用 单个 Apache 服 务 器 支撑 多 个 网 站 是 可 以 的 ， 但 这 样 并 不 灵活 ， 
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而 且 不 便 维护 。 如 果 那 些 网 站 有 不 同 用 户 运 行 的 话 ， 你 就 要 同时 维护 这 些 服务 器 和 用 户 。 相 反 ，， 
我 们 更 主张 在 单个 物理 服务 器 上 建立 多 个 虚拟 机 , 并 分 配给 各 个 用 户 , 这样 他 们 就 不 会 相互 干扰 ， 
而 你 也 可 以 随意 修改 或 移动 它们 。 

管理 虚拟 机 的 软件 叫 作 hypervisor。hypervisor 能 操控 本 书 提 及 的 Linux 底 层 的 各 个 部 分 , 令 虚 
拟 机 的 使 用 与 物理 机 无 异 。 


17.4 分布 式 计算 与 实时 计算 


为 了 简化 本 地 资源 的 管理 , 你 可 以 在 虚拟 机 技术 之 上 搭建 一 些 成 熟 的 工具 。 云 计算 就 是 关于 
这 方面 的 一 个 笼统 的 术语 。 其 中 的 基础 设施 即 服务 ( 以 下 简称 IaaS ) 就 是 一 种 能 让 你 指定 和 使 用 
远 端 CPU 、 内 存 、 存 储 和 网 络 等 基础 计算 资源 的 系统 。OpenStack 项 目 就 是 这 样 一 个 包含 了 IaaS 
的 接口 平台 。 

更 进一步 ， 你 还 可 以 指定 设施 上 的 操作 系统 、 数 据 库 服务 器 、Web 服 务 器 之 类 的 平台 资源 。 
这 种 级 别 的 服务 叫 作 平台 即 服务 ( 以 下 简称 PaaS )。 

Linux 是 这 些 服务 的 核心 ， 因 为 它 经 党 被 用 作 这 些 服务 的 底层 操作 系统 。 你 在 本 书 看 到 的 几 . 
乎 所 有 东西 ， 包 括 内 核 ， 都 能 体现 在 这 些 系统 上 。 


17.5 内 入 式 系 统 


诸如 音乐 播放 器 、 视 频 播 放 器 、 人 恒温 器 等 提供 特定 用 途 的 系统 都 是 谍 入 式 系统 。 你 可 拿 它 跟 
桌面 或 服务 器 系统 (能 做 各 种 事情 但 并 不 精 于 某 一 项 的 系统 ) 对 比 一 下 。 

你 可 以 认为 嵌入 式 系统 是 与 分 布 式 系 统 相 反 的 ,， 它 不 但 没有 打算 扩展 系统 的 规模 , 反而 总 是 
希望 缩减 它 ， 以 放 进 一 个 小 的 设备 中 。 当 今 最 流行 的 谍 人 式 Linux 应 该 是 Android 了 。 

和 代入 式 系 统 通 常 需要 由 特定 的 硬件 跟 软 件 组 合 而 成 。 比 如 说 ， 你 可 以 为 PC 添加 足够 的 网 络 
硬件 以 及 配置 正确 的 网 络 环境 , 来 使 其 成 为 一 个 无 线路 由 器 。 但 更 常见 的 做 法 是 买 一 个 抛 除 多 余 
硬件 而 只 保留 必要 硬件 的 小 型 专用 路 由 器 设备 。 例 如 ,路 由 器 与 桌面 机 需 相 比 需要 更 多 的 网 络 端 
口 ， 而 完全 不 需要 视频 或 音频 硬件 。 有 了 定制 的 硬件 之 后 ,还 要 有 定制 的 软件 ， 例 如 定制 操作 系 
统 和 用 户 界面 。 第 9 章 提 到 的 OpenWRT 就 是 一 个 这 样 的 Linux 定 制 发 行 版 。 

随 着 越 来 越 多 的 小 型 硬件 的 面世 , 骨 入 式 系 统 也 越发 受到 关注 ,尤其 是 能 将 处 理 器 、 内 存 和 
外 围 设备 集成 在 一 小 块 空间 上 的 单 片 系统 ,。 如 Raspberry Pi 和 BeagleBone 之 类 的 单 板 系统 就 是 这 种 
设计 ， 它 们 可 选择 一 些 Linux 变 种 来 作为 操作 系统 。 这 些 设备 提供 容易 接收 的 输出 以 及 传感器 输 
入， 可 用 Python 等 语言 来 操作 ， 使 得 它们 能 广泛 用 于 原型 设计 和 小 工具 的 制作 。 

各 个 般 入 式 Linux 的 差异 在 于 从 服务 器 /桌面 版 保留 了 多 少 功能 。 配 置 有 限 的 小 型 设备 必须 将 
基本 功能 以 外 的 东西 拿 掉 ， 以 节省 空间 。 也 就 是 说 ， 甚 至 可 能 连 shell 和 一 些 核心 工具 都 要 由 
BusyBox 来 提供 。 这 些 系统 与 完整 安装 的 Linux 有 很 大 不 同 , 而 且 你 可 能 会 在 上 面 看 到 一 些 老 旧 的 
软件 ， 如 System V init。 
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供 藤 入 式 系 统 使 用 的 软件 ， 其 开发 平台 一 般 还 是 在 桌面 环境 上 。 而 一 些 更 强大 的 设备 如 
Raspberry Pi 则 拥有 更 丰富 的 存储 空间 和 更 强 的 能 力 来 运行 许多 开发 工具 。 

抛 开 不 同 的 部 分 ， 明 和 人 式 设备 也 具备 本 书 描述 的 Linux 基 因 : 内 核 、 设 备 、 网 络 接口 、init、 
用 户 进 程 。 骨 入 式 的 内 核 跟 普通 的 内 核 相 近 (或 者 说 一 样 )， 只 是 很 多 功能 被 屏蔽 了 。 从 底层 越 
往 上 层 走 ， 才 会 越 觉得 它 跟 一 般 的 Linux 不 同 。 


17.6 结束语 


关于 Linux， 不 论 你 的 学 习 目 标 是 什么 ， 我 都 希望 本 书 对 你 有 益 。 而 我 的 目标 就 是 ， 让 你 有 
信心 能 在 系统 中 修改 或 创建 东西 。 至 此 ， 你 应 该 能 掌控 你 的 系统 了 ， 现 在 就 去 亲身 实践 吧 。 
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， 都 将 在 立项 后 马上 在 社区 公布 。 如 果 你 有 意 翻译 哪 本 图 书 ， 欢 迎 
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Linux 是 了 解 操作 系统 工作 机 制 的 最 佳 平台 。 我 们 大 多 数 人 都 用 了 多 年 电脑 ， 但 对 电脑 背后 的 工作 机 制 却 一 无 
所 知 ， 而 本 书 就 是 解除 这 一 困惑 的 绝 好 途径 。 本 书 能 让 你 对 使 用 的 计算 机 有 所 了 解 ， 熟 悉 软件 的 基本 工作 原理 ， 
以 及 理解 系统 作为 一 个 整体 是 如 何 工 作 的 。 根 据 系统 启动 的 大 体 顺 序 ， 本 书 深入 介绍 了 从 设备 管理 到 网 络 配 置 的 
各 个 部 分 ， 演 示 了 系统 各 部 分 的 运行 方式 ， 并 介绍 了 一 些 基 本 技巧 和 开发 人 员 常 用 的 工具 。 

我 们 学 习 Linux 的 原因 可 能 各 不 相同 。 对 于 IT 从 业者 ( 如 系统 运 维 人 员 ) 来 说 ， 他 们 需要 了 解 本 书 中 的 几乎 所 
有 内 容 。 对 于 Linux 软 件 架构 和 开发 人 员 来 说 ， 他 们 同样 需要 了 解 这 些 内 容 ， 以 便 发 挥 操作 系统 的 最 大 功效 。 对 于 
研究 人 员 和 学 生来 说 ， 本 书 能 够 让 他 们 理解 为 什么 我 们 要 这 样 设置 系统 。 本 书 菜鸟 与 老 鸟 通 吃 ， 既 可 作为 菜鸟 的 
入 门 教程 ， 也 可 以 作为 老 鸟 的 进 阶 指南 。 


“本 书 绝 不 是 枯燥 的 长 篇 大 论 ， 而 是 一 本 生动 的 Linux 教 程 。Ward 用 严谨 又 不 失 风趣 的 语言 和 一 个 个 鲜明 易 懂 
的 例子 ， 为 你 解除 “ 谈 命令 行 色 变 ” 的 魔 关 ， 让 你 非常 直观 地 了 解 Linux 系 统 背后 的 工作 原理 。 ” 


“Brian Ward 清 晰 明了 地 讲解 了 Linux 内 部 的 工作 机 制 ， 从 启动 到 磁盘 、 硬 件 等 的 各 个 方面 。 本 书 没有 教 你 深奥 
的 编程 ， 却 带 你 透彻 领会 系统 各 个 层次 是 如 何 工作 的 ， 让 你 明白 每 一 个 动作 执行 的 背后 到 底 隐藏 着 何 种 玄机 。” 
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